NVIDIA redefine el centro de datos: de guardar datos a fabricar inteligencia

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

NVIDIA ha encontrado una forma muy potente de explicar hacia dónde quiere llevar la infraestructura de inteligencia artificial: las “AI factories” o fábricas de IA. La idea es sencilla, pero cambia por completo la conversación. Durante décadas, los centros de datos se diseñaron para almacenar archivos, ejecutar aplicaciones y servir páginas web. Ahora, en la visión de NVIDIA, las nuevas instalaciones se construyen para producir inteligencia en tiempo real.

El cambio no es solo semántico. En una fábrica tradicional se transforma energía en bienes físicos. En una fábrica de IA, la energía eléctrica se transforma en tokens, la unidad mínima con la que trabajan los modelos de lenguaje, los agentes autónomos y los sistemas de razonamiento. Por eso las métricas importantes ya no son solo CPU, GPU, terabytes o disponibilidad. NVIDIA habla de tokens por segundo, tokens por vatio, coste por token, utilización y uptime. Dicho de otra forma: cada vatio que entra en el centro de datos debe convertirse en la mayor cantidad posible de inteligencia útil.

La IA agéntica cambia la carga de trabajo

La explicación de NVIDIA parte de un punto clave: la IA ya no se limita a responder una pregunta aislada. Los sistemas agénticos razonan, planifican, buscan información, usan herramientas, escriben código, llaman a otros servicios, recuperan contexto y ejecutan acciones. Además, pueden crear subagentes especializados que aprenden a usar herramientas concretas de un dominio empresarial.

Eso alarga mucho las cargas de trabajo. Una consulta simple puede convertirse en una cadena de pasos: interpretar la petición, buscar datos, consultar una base documental, coordinar varios modelos, generar una respuesta, validar resultados y ejecutar una acción. En ese escenario, la infraestructura no puede optimizarse solo para el pico de rendimiento de una GPU. Tiene que mantener en movimiento todo el flujo.

Ahí aparece el concepto de fábrica de IA como sistema completo. NVIDIA insiste en que el rendimiento depende de la coordinación entre modelos, cómputo acelerado, memoria rápida, red, almacenamiento, software de orquestación, CPU, energía y refrigeración. Si una de esas capas falla, la producción de tokens se ralentiza. Y si se ralentiza, el coste por token sube.

Métrica en una fábrica de IA	Por qué importa
Tokens por segundo	Mide la capacidad de respuesta y producción
Tokens por vatio	Relaciona rendimiento con consumo eléctrico
Coste por token	Determina si la IA puede escalar con margen
Utilización	Evita que infraestructura cara quede infrautilizada
Uptime	Mantiene la producción de inteligencia siempre activa
Latencia	Afecta a agentes, asistentes y servicios interactivos

Esta visión es importante porque sitúa la IA en el terreno industrial. Un modelo puede ser muy avanzado, pero si es caro de servir, consume demasiada energía o no responde con rapidez, su uso masivo se complica. La infraestructura deja de ser un soporte invisible y pasa a ser parte directa del producto.

El coste por token se convierte en la nueva unidad económica

NVIDIA presenta sus sistemas Blackwell Ultra y GB300 NVL72 como piezas diseñadas para reducir el coste de producir tokens a escala. Según la compañía, los sistemas GB300 NVL72 generan 50 veces más tokens por megavatio que la generación anterior basada en Hopper, con un coste por token 35 veces menor. Son cifras de fabricante y deben leerse como tales, pero muestran con claridad hacia dónde va la competencia: más rendimiento por la misma energía.

La empresa también sitúa su framework NVIDIA Dynamo como una capa crítica para orquestar inferencia de largo contexto y grandes volúmenes de solicitudes. En una fábrica de IA, el software no es un accesorio. Debe enrutar peticiones, gestionar memoria, coordinar servicios, equilibrar latencia y throughput, y mantener alta la utilización de los recursos. Si no lo hace bien, el hardware más caro puede acabar esperando datos o ejecutando tareas mal distribuidas.

La próxima plataforma Vera Rubin amplía esa narrativa. NVIDIA afirma que los sistemas basados en Vera Rubin, junto con LPX, están diseñados para elevar de nuevo el rendimiento por vatio y bajar el coste por token mediante una mayor optimización de pila completa. La lectura estratégica es evidente: la compañía no quiere competir solo con GPU, sino con arquitecturas completas para fábricas de IA.

Generación o tecnología	Promesa principal de NVIDIA
Hopper	Plataforma previa de referencia
Blackwell Ultra	Más tokens por megavatio y menor coste por token
GB300 NVL72	Hasta 50 veces más tokens por megavatio frente a Hopper
NVIDIA Dynamo	Orquestación de inferencia compleja y largo contexto
Vera Rubin + LPX	Mayor rendimiento por vatio para IA agéntica y razonamiento

Esta forma de medir el rendimiento tiene consecuencias para empresas y proveedores cloud. Si el negocio de IA depende de servir millones de peticiones, cada mejora en tokens por vatio afecta directamente a costes, precios y margen. La factura eléctrica ya no es un coste secundario: forma parte de la economía del producto.

Diseño conjunto: chips, red, memoria, energía y refrigeración

La tesis de NVIDIA también implica un cambio en el diseño de centros de datos. Las fábricas de IA no se pueden construir sumando servidores de forma aislada. Requieren codiseño extremo: hardware, red, memoria, almacenamiento, software, alimentación eléctrica y refrigeración deben planificarse juntos.

Esto explica el auge de sistemas rack-scale, refrigeración líquida, interconexiones de alta velocidad y diseños de referencia completos. La infraestructura de IA no se compra como un servidor tradicional. Se despliega como una unidad industrial donde el rack, la sala, la energía y el software forman parte de la misma arquitectura.

NVIDIA vincula este enfoque a sus diseños DSX y al uso de gemelos digitales mediante Omniverse DSX Blueprint, OpenUSD y activos SimReady. La idea es modelar instalaciones, hardware, alimentación, refrigeración y operaciones antes de construir, y seguir mejorándolas después del despliegue. En fábricas de IA a escala de megavatios o gigavatios, un error de diseño térmico, eléctrico o de distribución puede convertirse en una limitación cara durante años.

También es relevante el papel de los socios. NVIDIA cita colaboraciones con fabricantes y proveedores como Cisco, Dell, HPE, Lenovo y Supermicro para llevar estas arquitecturas a centros de datos empresariales. Esto encaja con el objetivo de la compañía: que las fábricas de IA no sean solo cosa de hiperescalares, sino también una infraestructura que empresas de finanzas, industria, salud, sector público o ciencia puedan construir o alquilar.

De herramienta ocasional a infraestructura empresarial

La frase más ambiciosa de NVIDIA es que toda organización necesitará construir o alquilar una fábrica de IA. Es una afirmación comercial, pero no está lejos de una tendencia real. A medida que los agentes se integran en programación, atención al cliente, finanzas, análisis documental, diseño industrial, robótica o simulación científica, la IA deja de ser una herramienta puntual y empieza a parecer una capacidad operativa permanente.

La propia NVIDIA asegura que utiliza su fábrica interna de IA para acelerar desarrollo, software y operaciones, con cientos de agentes autónomos ayudando a equipos de ingeniería y negocio. Ese ejemplo sirve para vender una idea: la IA no debe vivirse como una aplicación que se abre de vez en cuando, sino como una capa continua de razonamiento y acción dentro de la empresa.

Pero la adopción no será igual para todos. Algunas organizaciones construirán infraestructura propia por razones de escala, seguridad o soberanía. Otras alquilarán capacidad en cloud, neoclouds o proveedores especializados. Muchas combinarán ambas opciones. Lo importante será entender el coste real de cada token, la disponibilidad de energía, la gobernanza de datos, la latencia, el cumplimiento normativo y la capacidad de integrar modelos propios o abiertos.

Las fábricas de IA también plantean una cuestión incómoda: convierten la inteligencia artificial en infraestructura intensiva en energía. NVIDIA habla de transformar energía en inteligencia, y esa imagen resume muy bien el momento. La IA generativa, la IA agéntica y la robótica no flotan en una nube abstracta. Dependen de electricidad, chips, memoria, redes, almacenamiento, refrigeración y edificios físicos.

El futuro de la IA no se decidirá solo por quién tenga el mejor modelo. También por quién pueda producir más inteligencia con menos energía, menos coste y más fiabilidad. En esa batalla, NVIDIA quiere que la unidad económica deje de ser la GPU y pase a ser la fábrica completa.

Preguntas frecuentes

¿Qué es una fábrica de IA?
Es una infraestructura diseñada para producir inteligencia en tiempo real mediante modelos, agentes, cómputo acelerado, memoria, red, almacenamiento, software, energía y refrigeración coordinados como un sistema completo.

¿Por qué NVIDIA habla de tokens por vatio?
Porque en la IA generativa y agéntica el rendimiento económico depende de cuántos tokens puede producir una infraestructura con una cantidad determinada de energía.

¿Qué cambia con la IA agéntica?
Los agentes no solo responden preguntas. Planifican, usan herramientas, recuperan datos, coordinan subagentes y ejecutan tareas, lo que hace que las cargas sean más largas y exigentes.

¿Todas las empresas necesitarán una fábrica de IA propia?
No necesariamente. Algunas construirán infraestructura dedicada y otras alquilarán capacidad. Lo relevante será disponer de una forma fiable, eficiente y gobernada de usar IA a escala.

vía: blogs.nvidia