InicioTecnologíaInteligencia ArtificialDeepSeek afirma que su modelo de 'razonamiento' supera a O1 de OpenAI...

DeepSeek afirma que su modelo de ‘razonamiento’ supera a O1 de OpenAI en ciertos puntos

El laboratorio de IA chino Deepseek ha lanzado una versión abierta de Deepseek-R1, su llamado modelo de razonamiento, que afirma que funciona, así como el O1 de OpenAI en ciertos puntos de referencia de IA.

R1 está disponible en la plataforma AI Dev de Hugging Face una licencia MIT, lo que significa que se puede usar comercialmente sin restricciones. Según Deepseek, R1 vence a O1 en los puntos de referencia Aime, Math-500 y Swe Bench verificados. AIME emplea otros modelos para evaluar el rendimiento de un modelo, mientras que Math-500 es una colección de problemas de palabras. Mientras tanto, SWE-Bench se centra en las tareas de programación.

Al ser un modelo de razonamiento, R1 se verifica de manera efectiva, lo que ayuda a evitar algunas de las trampas que normalmente tropiezan con los modelos. Los modelos de razonamiento tardan un poco más, generalmente segundos de minutos más, para llegar a las soluciones en comparación con un modelo típico de no evaluar. La ventaja es que tienden a ser más confiables en dominios como física, ciencias y matemáticas.

R1 contiene 671 mil millones de parámetros,según ha comentado en un informe técnico el equipo de DeepSeek. Los parámetros corresponden aproximadamente a las habilidades de resolución de problemas de un modelo, y los modelos con más parámetros generalmente funcionan mejor que aquellos con menos parámetros.

De hecho, 671 mil millones de parámetros es algo masivo, pero DeepSeek también ha lanzado versiones «destiladas» de R1 que varían en tamaño de 1.5 mil millones de parámetros a 70 mil millones de parámetros. El más pequeño puede funcionar en una computadora portátil. En cuanto al R1 completo, requiere hardware más robusto, pero está Disponible a través de la API de Deepseek a precios 90% -95% más barato que el O1 de Openai.

Clem Delangue, el CEO de Hugging Face, dijo en una publicación en X que los desarrolladores de la plataforma han creado más de 500 modelos «derivados» de R1 que han acumulado 2.5 millones de descargas entre todas, cinco veces el número de descargas que ha obtenido el R1 oficial.

Se ha lanzado hace solo unos días y ya más de 500 modelos derivados de @deepseek_ai han sido creados en todo el mundo en @huggingface con 2.5 millones de descargas (5x que el original).

¡El poder de la IA de código abierto descentralizado!

– Clem 🤗 (@ClementDelangue) 27 de enero de 2025

Hay un inconveniente de R1. Siendo un modelo chino, está sujeto a margen de evaluación por el regulador de Internet de China para garantizar que sus respuestas «encarnen los valores socialistas centrales». R1 no responderá preguntas sobre Tiananmen Square, por ejemplo, o la autonomía de Taiwán.

Deepseek r1 Refusal — Filtrado de R1 en acción. **Créditos:** Deepseek

Muchos de los sistemas de IA chinos, incluidos otros modelos de razonamiento, se dan cuenta que responder a ciertos temas podrían elevar la ira de los reguladores en el país, como la especulación sobre el régimen de Xi Jinping.

R1 llega días después de que la administración Biden saliente propusiera reglas más duras de exportación y restricciones a las tecnologías de IA para empresas chinas. Ya se les impidió a las empresas de compra de chips AI avanzados, pero si las nuevas reglas entran en vigencia como se escriben, las empresas se enfrentarán a mayores y más estrictos controles tanto en la tecnología de semiconductores como en los modelos necesarios para arrancar sistemas de IA sofisticados.

En un documento de política la semana pasada, OpenAI instó al gobierno de los Estados Unidos a apoyar el desarrollo de la IA de los Estados Unidos, para que los modelos chinos no los coincidan o los superen en la capacidad. En un entrevista con The Information, el vicepresidente de política de OpenAI Chris Lehane destacó a High Flyer Capital Management, Deepseek’s la corporación propietaria de Deepseek, como una organización de particular preocupación.

Hasta ahora, al menos tres laboratorios chinos: Deepseek, Alibaba y Kimi, que es propiedad del unicornio chino Moonshot AI, ha producido modelos que afirman rivalizan con o1. Cabe destacar que Deepseek fue el primero anunciando una vista previa de R1 a finales de noviembre. En un correo en X, Dean Ball, un investigador de IA en la Universidad George Mason, dijo que la tendencia sugiere que los laboratorios de IA chinos continuarán siendo «seguidores rápidos de los avances».

“El impresionante rendimiento de los modelos destilados de Deepseek significa que los razonadores capaces continuarán proliferando ampliamente y serán ejecutables en el hardware local «, escribió Ball,» lejos de los ojos de cualquier régimen de control superior»

Artículo anterior

Licencias de código abierto: todo lo que se necesita saber

siguiente >>

DeepSeek y su impacto en la geopolítica

RELACIONADOS

¿La IA nos hace menos reflexivos?

OpenAI revela más sobre su proceso de pensamiento de modelo O3-Mini

Tipos de empresas de IA atractivas en 2025 para los capitalistas de riesgo

Hippocratic AI recauda 141 millones para crear agentes IA orientados al paciente

Construir una cultura sólida de desarrollo de startups requiere un ajuste constante

Goody-2, IA demasiado ética para discutir de cualquier cosa

DEI: últimos desafíos legales y corporativos

Políticas clave de IA: desbloquear su potencial y proteger de riesgos en el trabajo

Nunca es tarde para emprender

Gategroup y Realista Transforman la Experiencia del Empleado

Spotify lanza una agencia interna y prueba anuncios de voz en off generativos

El neobanco británico Monzo obtiene beneficios y prepara la expansión en la UE

El beneficio operativo de Samsung se dispara un 930% a medida que los vientos de cola de la IA impulsan la demanda de chips...

Poe presenta un modelo de ingresos de precio por mensaje para creadores de bots de IA

MoneyHash, acceso único a servicios de pago en MENA, recauda 5,2 millones

¿La IA nos hace menos reflexivos?

Respaldado por Mayo Clinic, el hardware de Nutrix monitorea el estrés

La startup bancaria europea Swan obtiene nuevos fondos en su serie B

MoneyHash, acceso único a servicios de pago en MENA, recauda 5,2 millones

Tipos de empresas de IA atractivas en 2025 para los capitalistas de riesgo

Nelly recauda 50 millones para digitalizar las consultas médicas en toda Europa

¿Podrían los reactores nucleares compactos de esta startup revolucionar la detección del cáncer?

Hippocratic AI recauda 141 millones para crear agentes IA orientados al paciente

La cronología que hay que conocer del Chatbot de AI

AI: resumen de principales conceptos

Como presentar una Startup a Inversores

Modelo OKR

Creación de un Plan Estratégico

DeepSeek afirma que su modelo de ‘razonamiento’ supera a O1 de OpenAI en ciertos puntos

¿La IA nos hace menos reflexivos?

OpenAI revela más sobre su proceso de pensamiento de modelo O3-Mini

Tipos de empresas de IA atractivas en 2025 para los capitalistas de riesgo

SUSCRÍBETE A TRPLANE.COM

Publica en TRPlane.com

MÁS PUBLICACIONES

En la presentación de una startup, la diapositiva del equipo es crucial

Las tecnologías clave para innovación desde las personas

TikTok rompe récords como la aplicación con mayor recaudación en el tercer trimestre

ChatGPT de OpenAI muestra por qué la implementación es clave con la IA generativa

Las nuevas habilidades profesionales