Rendimiento Revolucionario de NVIDIA Blackwell en Resultados de Entrenamiento MLPerf

NVIDIA ha anunciado avances significativos en el desarrollo y la implementación de «fábricas de IA», sistemas diseñados para acelerar el entrenamiento y despliegue de aplicaciones de inteligencia artificial de última generación. Estas plataformas utilizan la arquitectura Blackwell para satisfacer las demandas de rendimiento cada vez más exigentes de las nuevas aplicaciones.

En la última ronda de MLPerf Training, la plataforma de IA de NVIDIA ha demostrado ser la más potente a gran escala en todos los benchmarks presentados, destacándose especialmente en pruebas enfocadas en los modelos de lenguaje de gran envergadura. La arquitectura Blackwell, junto con sus sistemas Tyche y Nyx, ha logrado sobresalir en todas las evaluaciones del benchmark, subrayando su versatilidad y alto rendimiento en una amplia gama de cargas de trabajo de IA.

Una de las iniciativas más notables es la colaboración de NVIDIA con empresas como CoreWeave e IBM para utilizar sistemas compuestos por 2,496 GPUs Blackwell y 1,248 CPUs Grace de NVIDIA, logrando un rendimiento 2.2 veces superior en el preentrenamiento del nuevo Llama 3.1 405B en comparación con arquitecturas anteriores. Además, los sistemas DGX B200, potenciados por GPUs Blackwell, lograron un rendimiento 2.5 veces mayor en el ajuste fino de Llama 2 70B LoRA.

Estos avances se deben a mejoras significativas en la arquitectura Blackwell, que incluyen bastidores de alta densidad con refrigeración líquida, y tecnologías avanzadas de interconexión como NVLink de quinta generación y redes InfiniBand Quantum-2. El software NeMo Framework también juega un papel crucial, mejorando el entrenamiento de modelos de lenguaje multimodal de próxima generación y facilitando la implementación de aplicaciones de IA agentic.

El ecosistema de socios de NVIDIA ha participado activamente en estas iniciativas, incluyendo a compañías como ASUS, Cisco, Dell, Google Cloud y muchas más. Estos esfuerzos conjuntos apuntan a construir aplicaciones de IA que generen tokens y conocimientos valiosos aplicables en diversas industrias y ámbitos académicos, revolucionando así la economía de la IA agentic.
Fuente: Zona de blogs y prensa de Nvidia

Scroll al inicio