Spanish English Eesti French German Italian Portuguese
Marketing Social
InicioIANvidia lanza su propia marca de modelos mundiales

Nvidia lanza su propia marca de modelos mundiales

Nvidia se está adentrando en los modelos mundiales: modelos de IA que se inspiran en los modelos mentales del mundo que los humanos desarrollan de forma natural.

En CES 2025 en Las Vegas, la compañía anunció que pondrá a disposición de forma abierta una familia de modelos mundiales que pueden predecir y generar videos «conscientes de la física». Nvidia llama a esta familia Cosmos World Foundation Models, o Cosmos WFM para abreviar.

Los modelos, que se pueden ajustar para aplicaciones específicas, están disponibles en los catálogos API y NGC de Nvidia, GitHub y la plataforma de desarrollo de IA Hugging Face.

«Nvidia está poniendo a disposición la primera ola de Cosmos WFM para simulación basada en física y generación de datos sintéticos», escribió la compañía en una publicación de su blog. «Los investigadores y desarrolladores, independientemente del tamaño de su empresa, pueden utilizar libremente los modelos Cosmos bajo la permisiva licencia de modelo abierto de Nvidia que permite el uso comercial».

Modelos Nvidia Cosmos WFM
Salida de uno de los modelos Cosmos World Foundation de Nvidia.Créditos de imagen:NVIDIA

Hay varios modelos en la familia Cosmos WFM, divididos en tres categorías: Nano para aplicaciones de baja latencia y en tiempo real, Super para modelos «básicos de alto rendimiento» y Ultra para resultados de máxima calidad y fidelidad.

Los modelos varían en tamaño desde 4 mil millones a 14 mil millones de parámetros, siendo Nano el más pequeño y Ultra el más grande. Los parámetros corresponden aproximadamente a las habilidades de resolución de problemas de un modelo, y los modelos con más parámetros generalmente funcionan mejor que aquellos con menos parámetros.

Como parte de Cosmos WFM, Nvidia también está lanzando un «modelo de muestreo superior», un decodificador de video optimizado para realidad aumentada y modelos de seguridad y certeza para garantizar un uso responsable, así como modelos ajustados para aplicaciones como la generación de datos de sensores para el desarrollo de vehículos autónomos. Estos, así como los otros modelos Cosmos WFM, fueron entrenados en 9.000 billones de tokens de 20 millones de horas de interacciones humanas, ambientales, industriales, robóticas y de conducción en el mundo real, dijo Nvidia. En IA, los “tokens” representan bits de datos sin procesar; en este caso, secuencias de video.

Nvidia no dijo de dónde provienen estos datos de entrenamiento, pero al menos un informe, (y pleito) alega que la empresa entrenó con videos de YouTube con derechos de autor sin permiso.

Cuando se le contactó para hacer comentarios, un portavoz de Nvidia dijo que Cosmos «no está diseñado para copiar o infringir ninguna obra protegida».

«Cosmos aprende igual que la gente aprende», dijo el portavoz. “Para ayudar a Cosmos a aprender, recopilamos datos de una variedad de fuentes públicas y privadas y estamos seguros de que nuestro uso de los datos es consistente tanto con la letra como con el espíritu de la ley. Los datos sobre cómo funciona el mundo (que es lo que aprenden los modelos Cosmos) no están protegidos por derechos de autor ni están sujetos al control de ningún autor o empresa individual”.

Dejando de lado el hecho de que modelos como Cosmos en realidad no aprenden como aprende la gente, los expertos en derechos de autor dicen que afirmaciones como las de Nvidia, bajo la doctrina legal de uso legítimo puede no resistir un escrutinio judicial. Que estas empresas prevalezcan dependerá en gran medida de cómo los tribunales decidan qué es el uso legítimo, que permite el uso de obras protegidas por derechos de autor para crear algo nuevo siempre que sea transformador, y se aplica a la formación en IA.

Nvidia afirmó que los modelos Cosmos WFM, con fotogramas de texto o vídeo, pueden generar datos sintéticos «controlables y de alta calidad» para iniciar el entrenamiento de modelos para robótica, coches sin conductor, entre otros.

Modelos Nvidia Cosmos WFM
Cosmos puede simular entornos realistas como plantas de fábrica, según Nvidia.Créditos de imagen:NVIDIA

«El conjunto de modelos abiertos de Nvidia Cosmos significa que los desarrolladores pueden personalizar los WFM con conjuntos de datos, como grabaciones de vídeo de viajes de vehículos autónomos o robots que navegan por un almacén», escribió Nvidia en un comunicado de prensa. «Los Cosmos WFM están diseñados específicamente para la investigación y el desarrollo de la IA física, y pueden generar videos basados ​​en la física a partir de una combinación de entradas, como texto, imágenes y video, así como sensores de robots o datos de movimiento».

Nvidia dijo que empresas como Waabi, Wayve, Fortellix y Uber ya se han comprometido a poner a prueba los WFM Cosmos para diversos casos de uso, desde búsqueda y revisión de videos hasta la construcción de modelos de inteligencia artificial para vehículos autónomos.

«La IA generativa impulsará el futuro de la movilidad, ya que requerirá datos enriquecidos y computación muy poderosa», dijo el director ejecutivo de Uber, Dara Khosrowshahi. «Al trabajar con Nvidia, estamos seguros de que podemos ayudar a acelerar el cronograma para soluciones de conducción autónoma seguras y escalables para la industria».

Es importante señalar que los modelos mundiales de Nvidia no son de “código abierto” en el sentido más estricto. Para cumplir con una definición ampliamente aceptada de IA de “código abierto”, un modelo de IA debe proporcionar suficiente información sobre su diseño para que una persona pueda recrearlo “sustancialmente” y revelar cualquier detalle pertinente sobre sus datos de entrenamiento, incluida la procedencia y cómo se pueden obtener o licenciar los datos.

Nvidia no ha publicado los detalles de los datos de entrenamiento de Cosmos WFM ni ha puesto a disposición todas las herramientas necesarias para recrear los modelos desde cero. Probablemente esa sea la razón por la que el gigante tecnológico se refiere a los modelos como “abiertos” en lugar de código abierto.

“Realmente esperamos que Cosmos haga por el mundo de la robótica y la IA industrial lo que Llama ha hecho por las empresas», dijo el director ejecutivo de Nvidia, Jensen Huang.

 



Source link

RELACIONADOS

SUSCRÍBETE A TRPLANE.COM

Publica en TRPlane.com

Si tienes alguna historia interesante sobre transformación, IT, digital, etc con cabida en TRPlane.com por favor envíanosla y la compartiremos con toda la Comunidad

MÁS PUBLICACIONES

Activar Notificaciones OK No gracias