NVIDIA ha revelado los primeros datos de rendimiento de su esperado chip B200 para aplicaciones de inteligencia artificial (IA), superando las ya altas expectativas que había generado desde su anuncio en marzo de este año.
Un salto cuántico en rendimiento
Según los primeros resultados publicados por NVIDIA, el chip B200 multiplica por cuatro el rendimiento de su predecesor, la GPU H100 basada en la microarquitectura Hopper. Esta diferencia de rendimiento es considerada por los expertos como «una barbaridad» en términos de avance tecnológico.
En pruebas específicas, el B200 ha demostrado capacidades impresionantes:
- 10.755 tókenes por segundo en una prueba de inferencia
- 11.264 tókenes por segundo en un test de referencia offline
Características técnicas asombrosas
El Nvidia B200 destaca por sus especificaciones técnicas de vanguardia:
- 208.000 millones de transistores
- Arquitectura Blackwell de última generación
- 20 petaFLOPS máximos de rendimiento en operaciones FP4 con refrigeración líquida
- Capacidad para trabajar con un mapa de memoria de hasta 192 GB de VRAM
- Ancho de banda de 8 TB/s
Desafíos en la producción
NVIDIA ha admitido que la fabricación del B200 no ha sido sencilla. La compañía se vio obligada a rediseñar algunas capas del chip para mejorar el rendimiento de la producción. A pesar de estos contratiempos, NVIDIA espera comenzar la producción a gran escala durante el cuarto trimestre de 2024.
Implicaciones geopolíticas
Dadas las impresionantes capacidades del B200, se espera que el Departamento de Comercio de EE.UU. no permita a NVIDIA vender esta GPU en China, lo que podría tener implicaciones significativas en el mercado global de IA.
El futuro de la IA
El chip B200 se posiciona como la GPU para IA más capaz del mercado, estableciendo un nuevo estándar en el campo. Sin embargo, se espera que competidores como AMD y Huawei no tarden en responder con sus propias innovaciones.
Con el B200, NVIDIA no solo reafirma su liderazgo en el mercado de chips para IA, sino que también establece un nuevo punto de referencia para el rendimiento en aplicaciones de inteligencia artificial, prometiendo impulsar avances significativos en diversos campos de la tecnología y la industria.
Características del NVIDIA DGX B200
1. Especificaciones del Chip B200:
- Transistores: 208.000 millones.
- Arquitectura: Blackwell de última generación.
- Rendimiento Máximo: 20 petaFLOPS en operaciones FP4 con refrigeración líquida.
- Memoria VRAM: Hasta 192 GB.
- Ancho de Banda: 8 TB/s.
2. Especificaciones de la Plataforma DGX B200:
- GPU: 8 GPUs NVIDIA Blackwell.
- Memoria de GPU Total: 1440 GB.
- Rendimiento en Entrenamiento: 72 petaFLOPS.
- Rendimiento en Inferencia: 144 petaFLOPS.
- Consumo de Energía: ~14,3 kW máximo.
- CPU: 2 procesadores Intel® Xeon® Platinum 8570, con 112 núcleos en total (2,1 GHz base, 4 GHz impulso máximo).
- Memoria del Sistema: Hasta 4 TB.
3. Redes y Conectividad:
- Redes: 4 puertos OSFP para 8 VPI NVIDIA ConnectX-7 de un solo puerto, InfiniBand/Ethernet de hasta 400 Gb/s.
- DPU: 2 DPU de doble puerto QSFP112 NVIDIA BlueField-3 para InfiniBand/Ethernet de hasta 400 Gb/s.
- NIC Integrada: 10 Gb/s con RJ45, NIC Ethernet de doble puerto de 100 Gb/s.
4. Almacenamiento:
- SO: 2 NVMe M.2 de 1,9 TB.
- Almacenamiento Interno: 8 NVMe U.2 de 3,84 TB.
5. Software Incluido:
- NVIDIA AI Enterprise: Software de IA optimizado.
- NVIDIA Base Command™: Orquestación, programación y gestión de clústeres.
- DGX OS/Ubuntu: Sistema operativo.
6. Dimensiones y Refrigeración:
- Rack Units (RU): 10 RU.
- Dimensiones del Sistema:
- Altura: 444 mm (17,5 pulgadas).
- Ancho: 482,2 mm (19,0 pulgadas).
- Longitud: 897,1 mm (35,3 pulgadas).
- Temperatura Operativa: 5–30 °C (41–86 °F).
7. Soporte Empresarial:
- Soporte Técnico: Tres años para hardware y software.
- Portal de Soporte: Acceso ininterrumpido.
- Soporte en Vivo: Disponibilidad de un agente en directo durante el horario comercial local.
Este nivel de detalle proporciona una visión clara de la potencia y capacidades del chip B200, así como de la infraestructura que NVIDIA ha desarrollado para respaldar su uso en entornos empresariales avanzados.
Más información: Nvidia B200