InicioIANvidia lanza su propia marca de modelos mundiales

Nvidia lanza su propia marca de modelos mundiales

Nvidia se está adentrando en los modelos mundiales: modelos de IA que se inspiran en los modelos mentales del mundo que los humanos desarrollan de forma natural.

En CES 2025 en Las Vegas, la compañía anunció que pondrá a disposición de forma abierta una familia de modelos mundiales que pueden predecir y generar videos «conscientes de la física». Nvidia llama a esta familia Cosmos World Foundation Models, o Cosmos WFM para abreviar.

Los modelos, que se pueden ajustar para aplicaciones específicas, están disponibles en los catálogos API y NGC de Nvidia, GitHub y la plataforma de desarrollo de IA Hugging Face.

«Nvidia está poniendo a disposición la primera ola de Cosmos WFM para simulación basada en física y generación de datos sintéticos», escribió la compañía en una publicación de su blog. «Los investigadores y desarrolladores, independientemente del tamaño de su empresa, pueden utilizar libremente los modelos Cosmos bajo la permisiva licencia de modelo abierto de Nvidia que permite el uso comercial».

Modelos Nvidia Cosmos WFM — Salida de uno de los modelos Cosmos World Foundation de Nvidia.Créditos de imagen:NVIDIA

Hay varios modelos en la familia Cosmos WFM, divididos en tres categorías: Nano para aplicaciones de baja latencia y en tiempo real, Super para modelos «básicos de alto rendimiento» y Ultra para resultados de máxima calidad y fidelidad.

Los modelos varían en tamaño desde 4 mil millones a 14 mil millones de parámetros, siendo Nano el más pequeño y Ultra el más grande. Los parámetros corresponden aproximadamente a las habilidades de resolución de problemas de un modelo, y los modelos con más parámetros generalmente funcionan mejor que aquellos con menos parámetros.

Como parte de Cosmos WFM, Nvidia también está lanzando un «modelo de muestreo superior», un decodificador de video optimizado para realidad aumentada y modelos de seguridad y certeza para garantizar un uso responsable, así como modelos ajustados para aplicaciones como la generación de datos de sensores para el desarrollo de vehículos autónomos. Estos, así como los otros modelos Cosmos WFM, fueron entrenados en 9.000 billones de tokens de 20 millones de horas de interacciones humanas, ambientales, industriales, robóticas y de conducción en el mundo real, dijo Nvidia. En IA, los “tokens” representan bits de datos sin procesar; en este caso, secuencias de video.

Nvidia no dijo de dónde provienen estos datos de entrenamiento, pero al menos un informe, (y pleito) alega que la empresa entrenó con videos de YouTube con derechos de autor sin permiso.

Cuando se le contactó para hacer comentarios, un portavoz de Nvidia dijo que Cosmos «no está diseñado para copiar o infringir ninguna obra protegida».

«Cosmos aprende igual que la gente aprende», dijo el portavoz. “Para ayudar a Cosmos a aprender, recopilamos datos de una variedad de fuentes públicas y privadas y estamos seguros de que nuestro uso de los datos es consistente tanto con la letra como con el espíritu de la ley. Los datos sobre cómo funciona el mundo (que es lo que aprenden los modelos Cosmos) no están protegidos por derechos de autor ni están sujetos al control de ningún autor o empresa individual”.

Dejando de lado el hecho de que modelos como Cosmos en realidad no aprenden como aprende la gente, los expertos en derechos de autor dicen que afirmaciones como las de Nvidia, bajo la doctrina legal de uso legítimo puede no resistir un escrutinio judicial. Que estas empresas prevalezcan dependerá en gran medida de cómo los tribunales decidan qué es el uso legítimo, que permite el uso de obras protegidas por derechos de autor para crear algo nuevo siempre que sea transformador, y se aplica a la formación en IA.

Nvidia afirmó que los modelos Cosmos WFM, con fotogramas de texto o vídeo, pueden generar datos sintéticos «controlables y de alta calidad» para iniciar el entrenamiento de modelos para robótica, coches sin conductor, entre otros.

«El conjunto de modelos abiertos de Nvidia Cosmos significa que los desarrolladores pueden personalizar los WFM con conjuntos de datos, como grabaciones de vídeo de viajes de vehículos autónomos o robots que navegan por un almacén», escribió Nvidia en un comunicado de prensa. «Los Cosmos WFM están diseñados específicamente para la investigación y el desarrollo de la IA física, y pueden generar videos basados en la física a partir de una combinación de entradas, como texto, imágenes y video, así como sensores de robots o datos de movimiento».

Nvidia dijo que empresas como Waabi, Wayve, Fortellix y Uber ya se han comprometido a poner a prueba los WFM Cosmos para diversos casos de uso, desde búsqueda y revisión de videos hasta la construcción de modelos de inteligencia artificial para vehículos autónomos.

«La IA generativa impulsará el futuro de la movilidad, ya que requerirá datos enriquecidos y computación muy poderosa», dijo el director ejecutivo de Uber, Dara Khosrowshahi. «Al trabajar con Nvidia, estamos seguros de que podemos ayudar a acelerar el cronograma para soluciones de conducción autónoma seguras y escalables para la industria».

Es importante señalar que los modelos mundiales de Nvidia no son de “código abierto” en el sentido más estricto. Para cumplir con una definición ampliamente aceptada de IA de “código abierto”, un modelo de IA debe proporcionar suficiente información sobre su diseño para que una persona pueda recrearlo “sustancialmente” y revelar cualquier detalle pertinente sobre sus datos de entrenamiento, incluida la procedencia y cómo se pueden obtener o licenciar los datos.

Nvidia no ha publicado los detalles de los datos de entrenamiento de Cosmos WFM ni ha puesto a disposición todas las herramientas necesarias para recrear los modelos desde cero. Probablemente esa sea la razón por la que el gigante tecnológico se refiere a los modelos como “abiertos” en lugar de código abierto.

“Realmente esperamos que Cosmos haga por el mundo de la robótica y la IA industrial lo que Llama ha hecho por las empresas», dijo el director ejecutivo de Nvidia, Jensen Huang.

Source link

Artículo anterior

Grove reduce el tiempo de inscripción en ensayos clínicos con IA

siguiente >>

Licencias de código abierto: todo lo que se necesita saber

RELACIONADOS

¿La IA nos hace menos reflexivos?

OpenAI revela más sobre su proceso de pensamiento de modelo O3-Mini

Tipos de empresas de IA atractivas en 2025 para los capitalistas de riesgo

Hippocratic AI recauda 141 millones para crear agentes IA orientados al paciente

Construir una cultura sólida de desarrollo de startups requiere un ajuste constante

Goody-2, IA demasiado ética para discutir de cualquier cosa

DEI: últimos desafíos legales y corporativos

Políticas clave de IA: desbloquear su potencial y proteger de riesgos en el trabajo

Nunca es tarde para emprender

Gategroup y Realista Transforman la Experiencia del Empleado

Spotify lanza una agencia interna y prueba anuncios de voz en off generativos

El neobanco británico Monzo obtiene beneficios y prepara la expansión en la UE

El beneficio operativo de Samsung se dispara un 930% a medida que los vientos de cola de la IA impulsan la demanda de chips...

Poe presenta un modelo de ingresos de precio por mensaje para creadores de bots de IA

MoneyHash, acceso único a servicios de pago en MENA, recauda 5,2 millones

¿La IA nos hace menos reflexivos?

Respaldado por Mayo Clinic, el hardware de Nutrix monitorea el estrés

La startup bancaria europea Swan obtiene nuevos fondos en su serie B

MoneyHash, acceso único a servicios de pago en MENA, recauda 5,2 millones

Tipos de empresas de IA atractivas en 2025 para los capitalistas de riesgo

Nelly recauda 50 millones para digitalizar las consultas médicas en toda Europa

¿Podrían los reactores nucleares compactos de esta startup revolucionar la detección del cáncer?

Hippocratic AI recauda 141 millones para crear agentes IA orientados al paciente

La cronología que hay que conocer del Chatbot de AI

AI: resumen de principales conceptos

Como presentar una Startup a Inversores

Modelo OKR

Creación de un Plan Estratégico

Nvidia lanza su propia marca de modelos mundiales

¿La IA nos hace menos reflexivos?

OpenAI revela más sobre su proceso de pensamiento de modelo O3-Mini

Tipos de empresas de IA atractivas en 2025 para los capitalistas de riesgo

SUSCRÍBETE A TRPLANE.COM

Publica en TRPlane.com

MÁS PUBLICACIONES

Retención de talento: estrategias de compensación flexible

La Cartera de Identidad Digital de la UE

La equidad del producto es imperativo en los productos digitales

Nueva valoración de Revolut durante el replanteamiento de las fintechs

Klarna avanza hacia una IPO, y no es la única