Spanish English Eesti French German Italian Portuguese
Marketing Social
InicioTecnologíaInteligencia ArtificialDeepSeek afirma que su modelo de 'razonamiento' supera a O1 de OpenAI...

DeepSeek afirma que su modelo de ‘razonamiento’ supera a O1 de OpenAI en ciertos puntos

El laboratorio de IA chino Deepseek ha lanzado una versión abierta de Deepseek-R1, su llamado modelo de razonamiento, que afirma que funciona, así como el O1 de OpenAI en ciertos puntos de referencia de IA.

R1 está disponible en la plataforma AI Dev de Hugging Face una licencia MIT, lo que significa que se puede usar comercialmente sin restricciones. Según Deepseek, R1 vence a O1 en los puntos de referencia Aime, Math-500 y Swe Bench verificados. AIME emplea otros modelos para evaluar el rendimiento de un modelo, mientras que Math-500 es una colección de problemas de palabras. Mientras tanto, SWE-Bench se centra en las tareas de programación.

Al ser un modelo de razonamiento, R1 se verifica de manera efectiva, lo que ayuda a evitar algunas de las trampas que normalmente tropiezan con los modelos. Los modelos de razonamiento tardan un poco más, generalmente segundos de minutos más, para llegar a las soluciones en comparación con un modelo típico de no evaluar. La ventaja es que tienden a ser más confiables en dominios como física, ciencias y matemáticas.

R1 contiene 671 mil millones de parámetros,según ha comentado en un informe técnico el equipo de DeepSeek. Los parámetros corresponden aproximadamente a las habilidades de resolución de problemas de un modelo, y los modelos con más parámetros generalmente funcionan mejor que aquellos con menos parámetros.

De hecho, 671 mil millones de parámetros es algo masivo, pero DeepSeek también ha lanzado versiones «destiladas» de R1 que varían en tamaño de 1.5 mil millones de parámetros a 70 mil millones de parámetros. El más pequeño puede funcionar en una computadora portátil. En cuanto al R1 completo, requiere hardware más robusto, pero está Disponible a través de la API de Deepseek a precios 90% -95% más barato que el O1 de Openai.

Clem Delangue, el CEO de Hugging Face, dijo en una publicación en X que los desarrolladores de la plataforma han creado más de 500 modelos «derivados» de R1 que han acumulado 2.5 millones de descargas entre todas, cinco veces el número de descargas que ha obtenido el R1 oficial.

Se ha lanzado hace solo unos días y ya más de 500 modelos derivados de @deepseek_ai han sido creados en todo el mundo en @huggingface con 2.5 millones de descargas (5x que el original).

¡El poder de la IA de código abierto descentralizado!

– Clem 🤗 (@ClementDelangue) 27 de enero de 2025

Hay un inconveniente de R1. Siendo un modelo chino, está sujeto a margen de evaluación por el regulador de Internet de China para garantizar que sus respuestas «encarnen los valores socialistas centrales». R1 no responderá preguntas sobre Tiananmen Square, por ejemplo, o la autonomía de Taiwán.

Deepseek r1 Refusal
Filtrado de R1 en acción. Créditos: Deepseek

Muchos de los sistemas de IA chinos, incluidos otros modelos de razonamiento, se dan cuenta que responder a ciertos temas podrían elevar la ira de los reguladores en el país, como la especulación sobre el régimen de Xi Jinping.

R1 llega días después de que la administración Biden saliente propusiera reglas más duras de exportación y restricciones a las tecnologías de IA para empresas chinas. Ya se les impidió a las empresas de compra de chips AI avanzados, pero si las nuevas reglas entran en vigencia como se escriben, las empresas se enfrentarán a mayores y más estrictos controles tanto en la tecnología de semiconductores como en los modelos necesarios para arrancar sistemas de IA sofisticados.

En un documento de política la semana pasada, OpenAI instó al gobierno de los Estados Unidos a apoyar el desarrollo de la IA de los Estados Unidos, para que los modelos chinos no los coincidan o los superen en la capacidad. En un entrevista con The Information, el vicepresidente de política de OpenAI Chris Lehane destacó a High Flyer Capital Management, Deepseek’s la corporación propietaria de Deepseek, como una organización de particular preocupación.

Hasta ahora, al menos tres laboratorios chinos: Deepseek, Alibaba y Kimi, que es propiedad del unicornio chino Moonshot AI, ha producido modelos que afirman rivalizan con o1. Cabe destacar que Deepseek fue el primero anunciando una vista previa de R1 a finales de noviembre. En un correo en X, Dean Ball, un investigador de IA en la Universidad George Mason, dijo que la tendencia sugiere que los laboratorios de IA chinos continuarán siendo «seguidores rápidos de los avances».

“El impresionante rendimiento de los modelos destilados de Deepseek significa que los razonadores capaces continuarán proliferando ampliamente y serán ejecutables en el hardware local «, escribió Ball,» lejos de los ojos de cualquier régimen de control superior»

RELACIONADOS

SUSCRÍBETE A TRPLANE.COM

Publica en TRPlane.com

Si tienes alguna historia interesante sobre transformación, IT, digital, etc con cabida en TRPlane.com por favor envíanosla y la compartiremos con toda la Comunidad

MÁS PUBLICACIONES

Activar Notificaciones OK No gracias