NVIDIA ha anunciado una oleada de modelos abiertos, conjuntos de datos y herramientas que abarcan razonamiento en lenguaje, robótica/IA física y biomedicina, con el objetivo de democratizar el desarrollo y acelerar la innovación sobre su infraestructura acelerada. Las novedades llegan bajo las familias Nemotron (razonamiento y agentes), Cosmos (mundos sintéticos y visión multimodal para IA física), Isaac GR00T (modelos fundacionales robóticos) y Clara (ciencia y salud), y se publican en Hugging Face junto a utilidades de la suite NeMo para síntesis de datos y post-entrenamiento.
La compañía subraya que su compromiso con lo abierto no es meramente declarativo: ya supera los 650 modelos y 250 conjuntos de datos abiertos en Hugging Face, y ahora suma nuevos pesos, datos y “recipes” pensados para construir agentes especializados, simular el mundo con fidelidad física y acelerar descubrimientos biomédicos.
Nemotron: razonamiento ultraeficiente para agentes especializados
Los agentes de IA modernos ven, recuperan, generan y razonan encadenando modelos. La última hornada de Nemotron intenta unificarlos y optimizar el throughput:
- Nemotron Nano 3: arquitectura Mixture-of-Experts híbrida centrada en razonamiento de alta eficiencia (soporte, desarrollo de software, TI).
- Nemotron Nano 2 VL: inteligencia documental y razonamiento multimodal (imagen y vídeo).
- Nemotron Parse: extracción de texto y tablas con vistas a acciones posteriores (RPA, analítica).
- Nemotron Safety Guard: moderación multilingüe con sensibilidad cultural (23 categorías de seguridad, 9 idiomas).
- RAG unificado: nuevos modelos con extracción documental avanzada y recuperación sobre texto, imagen, audio y vídeo.
Para facilitar customización segura, NVIDIA publica datasets Nemotron (multimodal, personas multilingües, PI sintética con preservación de privacidad) y añade NeMo Data Designer (síntesis de datos) y NeMo-RL (post-entrenamiento/Refuerzo), de modo que las empresas puedan afinar sus agentes sin perder control sobre coste, calidad y riesgo.
Tracción empresarial: de Apriel 2.0 a seguridad “agéntica”
El ecosistema ya empieza a operacionalizar estos modelos abiertos. ServiceNow presentó Apriel 2.0, un modelo de razonamiento multimodal de pesos abiertos —post-entrenado con datos de NVIDIA y de la propia plataforma— orientado a workflows transversales y a sectores regulados (finanzas, salud, telco). Palantir expone Nemotron en Ontology/Foundry y AIP, CrowdStrike integra agentes autónomos y aprendices en su Agentic Security Platform, PayPal reporta +50 % en throughput y eficiencia de costes de sus servicios de IA, y Cadence y Synopsys colaboran en agentes de diseño de chips con NeMo Agent Toolkit y Nemotron. Zoom adopta Nemotron para agentes personalizados alineados a casos de uso de clientes.
Cosmos e Isaac GR00T: la “IA física” se entrena con mundos sintéticos y modelos fundacionales robóticos
Para robots, vehículos y agentes encarnados, NVIDIA refuerza su stack de modelos abiertos y datos:
- Cosmos Predict 2.5: unifica Text2World, Image2World y Video2World en un solo modelo capaz de simular mundos y generar vídeo multicámara (p. ej., 30 segundos desde un único fotograma).
- Cosmos Transfer 2.5: estilo-transfer espacial más fotorrealista a un tercio del tamaño del modelo previo, mejorando alineamiento al prompt y consistencia física.
- Cosmos Reason: VLM de razonamiento disponible como NIM microservice para comprensión multimodal avanzada.
- Cosmos Dataset Search: búsqueda instantánea de escenarios ayuda a recortar ciclos de post-entrenamiento de meses a días.
- Isaac GR00T N1.6: sube el listón en razonamiento, generalización y control de cuerpo completo, con énfasis en humanoides.
Además, se libera el mayor dataset abierto para IA física: 1.700 horas de sensores de conducción multimodal en EE. UU. y Europa, más datos de entrenamiento GR00T, que ya escalan al top-10 histórico de descargas en Hugging Face. Empresas como Agility Robotics, Amazon Robotics, Figure AI, Skild AI, Milestone Systems y Uber adoptan Cosmos/GR00T para generar sintéticos, enseñar comportamientos y desplegar agentes físicos a escala.
Clara: modelos abiertos para ciencia, imagen médica y diseño de proteínas
En ciencia y salud, la familia NVIDIA Clara suma tres modelos clave:
- Clara CodonFM: aprende reglas del RNA para comprender cómo cambios en el código influyen en diseño de terapias y medicamentos. Se aportará a la plataforma de células virtuales de Chan Zuckerberg Initiative, acelerando colaboración abierta y evaluación de modelos.
- Clara La-Proteina: genera estructuras 3D atómicas de proteínas a el doble de longitud y complejidad que modelos anteriores, abriendo vías a fármacos, enzimas y materiales mejor diseñados.
- Clara Reason: VLM para cadena de razonamiento en radiología e imagen médica, con foco en explicabilidad y investigación clínica.
Disponibilidad y despliegue: abierto… y productivo
Los modelos Nemotron y Cosmos (entrenados en DGX Cloud) están ya en build.nvidia.com, Hugging Face, OpenRouter y Azure AI Foundry; llegarán a Vertex AI y otros proveedores. Clara e Isaac GR00T se publican en Hugging Face. Para operar en producción, NVIDIA empaqueta versiones como microservicios NIM, de modo que puedan desplegarse de forma segura y escalable en DGX Cloud o en cualquier infraestructura acelerada por NVIDIA, con máxima privacidad y control.
Por qué esto importa
- Razonamiento utilizable: los agentes —no solo chatbots— exigen entender documentos, ver, recordar y actuar. Nemotron lleva el razonamiento eficiente a dominios concretos con seguridad y moderación integradas.
- IA física a velocidad: Cosmos + GR00T acercan la simulación plausible y los fundacionales robóticos a equipos que necesitan datos etiquetados, coherencia multicámara y variaciones controladas (clima, luz, terreno) para cerrar el gap sim-to-real.
- Ciencia abierta: Clara libera modelos con aplicación directa en genómica, proteómica e imagen médica, alimentando una colaboración que reduce costes y acelera el ciclo de descubrimiento.
- De lo abierto a lo operable: ofrecer pesos, datasets y el envoltorio NIM permite pasar del laboratorio a servicios estables sin rehacer integraciones.
Preguntas frecuentes
¿Qué diferencia a Nemotron de otros LLM abiertos?
Nemotron prioriza razonamiento eficiente y composición de capacidades para agentes (RAG multimodal, parsing, moderación multilingüe, VLM), además de datasets y herramientas NeMo para afinar y gobernar modelos en dominios regulados.
¿Cómo ayuda Cosmos a la robótica y a la “IA física”?
Genera mundos sintéticos y vídeo multicámara coherente desde texto/imagen/vídeo, y aplica transferencia espacial realista para multiplicar escenarios (clima, iluminación, terreno), con etiquetas perfectas y consistencia física para entrenar percepción y control.
¿Qué aporta Isaac GR00T a humanoides y robots móviles?
Como modelo fundacional robótico, mejora razonamiento, generalización y control de cuerpo completo; junto a Cosmos, permite enseñar nuevas habilidades con menos datos reales y mejor transferencia al mundo físico.
¿Puedo usar estos modelos en producción con garantías?
Sí. NVIDIA publica versiones como NIM microservices con APIs estables, observabilidad y opciones de despliegue en DGX Cloud o infra propia acelerada por NVIDIA, facilitando seguridad, escalado y MLOps.
¿Dónde se descargan y qué licencias tienen?
Los modelos y datos están en build.nvidia.com, Hugging Face, OpenRouter y Azure AI Foundry (y próximamente en Vertex AI). Las licencias son abiertas, con detalles en cada repositorio para su uso, adaptación y redistribución.
vía: blogs.nvidia



