Nuevo Avance de la Plataforma Blackwell de NVIDIA Incrementa la Eficiencia Hídrica en Más de 300 Veces

En los últimos años, los centros de datos se han enfrentado a un desafío creciente debido al incremento del tamaño de los modelos de inteligencia artificial (IA) y al aumento en el uso de modelos de razonamiento de IA. Tradicionalmente, estos centros han utilizado sistemas de refrigeración por aire, donde enfriadores mecánicos circulan aire frío para absorber el calor de los servidores, manteniéndolos en condiciones óptimas. Sin embargo, este método se ha vuelto más complejo, costoso y poco eficiente en términos energéticos a medida que los modelos de IA crecen en magnitud.

Los centros de datos que solían operar a 20 kW por rack ahora deben soportar más de 135 kW por rack, lo que multiplica por diez la dificultad para disipar el calor generado por estos racks de alta densidad. Para mantener el rendimiento óptimo de los servidores de IA, es necesario adoptar enfoques nuevos que ofrezcan eficiencia y escalabilidad.

Aquí entra en juego la refrigeración por líquido, un método que reduce la dependencia de los enfriadores de aire y facilita una eliminación del calor más eficiente, impulsando así a la próxima generación de infraestructuras de IA de alta eficiencia energética. Sistemas refrigerados por líquido como el NVIDIA GB200 NVL72 y el NVIDIA GB300 NVL72 están diseñados para manejar las imponentes tareas de inferencia de modelos de lenguaje con billones de parámetros. Su arquitectura está optimizada para mejorar la precisión y el rendimiento en la escala del tiempo de prueba, convirtiéndose en una elección ideal para ejecutar modelos de razonamiento de IA mientras se gestionan eficientemente los costos energéticos y el calor.

Históricamente, solo la refrigeración ha llegado a representar hasta el 40% del consumo eléctrico de un centro de datos, constituyéndose en una de las áreas con mayor potencial para reducir costos operativos y demandas energéticas. La refrigeración líquida permite mitigar tanto los costos como el uso de energía al capturar el calor directamente en su fuente. En lugar de depender del aire como intermediario, la refrigeración líquida transfiere el calor en un circuito cerrado de enfriamiento. A través de intercambiadores de calor, el calor es ciclado y posteriormente transferido al sistema de refrigeración de la instalación. Gracias a la mayor eficiencia en la transferencia de calor, los centros de datos y las fábricas de IA pueden operar eficientemente a temperaturas del agua más altas, reduciendo o eliminando la necesidad de enfriadores mecánicos.

El sistema NVIDIA GB200 NVL72, basado en la plataforma Blackwell de NVIDIA, ofrece un rendimiento excepcional mientras balancea el costo energético y la generación de calor. Proporciona una densidad de cómputo sin precedentes, con un potencial de ingresos 40 veces mayor, un rendimiento 30 veces más alto, 25 veces más eficiencia energética y 300 veces más eficiencia hídrica que las arquitecturas tradicionales refrigeradas por aire. Los sistemas más nuevos, como el NVIDIA GB300 NVL72, construidos sobre la plataforma Blackwell Ultra, cuentan con un potencial de ingresos 50 veces mayor, un rendimiento 35 veces superior y una eficiencia energética 30 veces superior.

Los centros de datos invierten entre 1.9 y 2.8 millones de dólares por megavatio al año, de los cuales cerca de medio millón se destinan anualmente a costos energéticos y de agua relacionados con la refrigeración. Al implementar el sistema refrigerado por líquido GB200 NVL72, los centros de datos de hiperescala y fábricas de IA pueden alcanzar ahorros de costos de hasta 25 veces, lo que se traduce en más de 4 millones de dólares en ahorros anuales para un centro de datos de 50 MW.

Esto se traduce en menores costos operacionales y una infraestructura a prueba del futuro que escale eficientemente las cargas de trabajo de IA, sin la insostenible huella hídrica de los métodos de refrigeración heredados. A medida que la densidad de cómputo aumenta y las cargas de trabajo de IA generan cargas térmicas sin precedentes, los centros de datos deben replantearse cómo eliminar el calor de su infraestructura, siendo la refrigeración líquida una respuesta eficaz para estas nuevas exigencias.
Fuente: Zona de blogs y prensa de Nvidia

Scroll al inicio