NVIDIA ha presentado en la conferencia GTC su nueva familia de modelos abiertos de IA con razonamiento, denominada Llama Nemotron, destinada a facilitar a desarrolladores y empresas la creación de agentes de IA capaces de resolver tareas complejas de forma autónoma o en colaboración.
Basados en la arquitectura de los modelos Llama, estos nuevos modelos han sido mejorados mediante un proceso intensivo de post-entrenamiento, logrando una mejora de hasta un 20 % en precisión respecto al modelo base y multiplicando por cinco la velocidad de inferencia frente a otros modelos abiertos de razonamiento. Esta optimización permite a las empresas reducir costes operativos y ejecutar tareas de razonamiento más avanzadas.
Una apuesta por agentes inteligentes para empresas
Los modelos Llama Nemotron están disponibles como microservicios NVIDIA NIM™ en tres tamaños: Nano, Super y Ultra. El modelo Nano está pensado para dispositivos edge y PC con alta precisión; el modelo Super ofrece el máximo rendimiento en una sola GPU, mientras que el Ultra está diseñado para entornos multi-GPU con necesidades de inferencia intensiva y máxima precisión en el razonamiento.
Estos modelos se entrenaron en NVIDIA DGX Cloud utilizando datos sintéticos generados por NVIDIA Nemotron™ y conjuntos de datos adicionales cocreados por la compañía, y los recursos de desarrollo y técnicas de optimización también estarán disponibles abiertamente para que las empresas puedan personalizar sus propios modelos de razonamiento.
Colaboraciones estratégicas con líderes globales
Empresas líderes en plataformas de IA y servicios empresariales ya trabajan junto a NVIDIA para integrar estos modelos. Microsoft integrará los modelos de razonamiento Llama Nemotron en su catálogo Azure AI Foundry, ampliando las capacidades del Azure AI Agent Service para Microsoft 365.
SAP también se apoyará en estos modelos para potenciar las soluciones de SAP Business AI y su asistente inteligente Joule, mejorando la comprensión de consultas de los usuarios y aumentando la precisión de las funciones de autocompletado en el lenguaje de programación ABAP.
Por su parte, ServiceNow, Accenture y Deloitte están utilizando Llama Nemotron para desarrollar agentes de IA capaces de ofrecer un mayor rendimiento y precisión, transformando la productividad empresarial en sectores clave como la consultoría, la ciberseguridad y la automatización de procesos.
Walter Sun, director global de IA en SAP, subrayó: “Estos modelos avanzados de razonamiento permitirán a nuestros asistentes inteligentes comprender mejor las preguntas de los usuarios y proporcionar respuestas más eficientes, impulsando la innovación empresarial”.
Nuevas herramientas para agentes de IA empresariales
Dentro del ecosistema NVIDIA AI Enterprise, los desarrolladores dispondrán de herramientas clave para adoptar rápidamente IA de razonamiento y agentes colaborativos, entre ellas:
- NVIDIA AI-Q Blueprint, que conecta bases de conocimiento con agentes de IA capaces de percibir, razonar y actuar de manera autónoma.
- NVIDIA AI Data Platform, una infraestructura de referencia para agentes de consulta de datos.
- Nuevos microservicios NVIDIA NIM y NeMo, que permiten aprendizaje continuo y adaptación en tiempo real, optimizando aplicaciones complejas de IA.
- El toolkit NVIDIA AgentIQ, disponible como código abierto en GitHub, que facilita la transparencia y optimización de los agentes.
Disponibilidad
Los modelos Llama Nemotron Nano y Super, junto con los microservicios NIM, ya están disponibles como API en build.nvidia.com y Hugging Face, de forma gratuita para miembros del NVIDIA Developer Program.
Las empresas podrán ejecutar estos microservicios en entornos productivos con NVIDIA AI Enterprise en infraestructuras de centro de datos y nube acelerada. La disponibilidad del blueprint NVIDIA AI-Q se espera para abril.
Con este lanzamiento, NVIDIA refuerza su apuesta por una IA abierta, accesible y preparada para transformar industrias a través de agentes inteligentes con capacidades de razonamiento avanzadas.