Elon Musk solicita 100.000 GPUs adicionales a NVIDIA para el superordenador Colossus, el sistema de IA más potente del mundo

Elon Musk y NVIDIA han dado un paso más en la carrera por el liderazgo en inteligencia artificial con una nueva solicitud de 100.000 GPUs Hopper H100 adicionales para el superordenador Colossus, propiedad de xAI, con sede en Memphis, Tennessee. Con esta expansión, el sistema alcanzará un total de 200.000 GPUs, consolidándose como el superordenador de IA más poderoso del planeta.

Colossus: un titán en la inteligencia artificial a gran escala

El clúster Colossus ha sido desarrollado para entrenar la familia de modelos de lenguaje Grok, propiedad de xAI, con los cuales la compañía busca competir directamente con los grandes del sector como OpenAI, Google y Meta. Esta ampliación permitirá a xAI duplicar la capacidad de procesamiento y entrenar modelos de IA a un ritmo sin precedentes, en un esfuerzo de Musk por posicionarse al nivel de líderes del sector como ChatGPT y Gemini.

Construido en tiempo récord, el superordenador inicial se completó en tan solo 122 días, con los primeros 100.000 procesadores instalados en 19 días. Con esta nueva adquisición, Musk y NVIDIA planean superar la marca de instalación anterior, un desafío logístico y técnico que permitirá a xAI seguir expandiéndose en el mercado de IA con una ventaja tecnológica sin igual.

NVIDIA Spectrum-X, clave en el rendimiento de Colossus

La infraestructura de Colossus se basa en la tecnología de redes Ethernet Spectrum-X de NVIDIA, diseñada específicamente para soportar las demandas de procesamiento intensivo de IA. Este sistema, integrado por conmutadores Ethernet SN5600 y SuperNICs BlueField-3, permite alcanzar velocidades de hasta 800 Gb/s en puertos, manteniendo un 95% de rendimiento sin pérdidas de paquetes, gracias a su avanzada gestión de congestión.

Gilad Shainer, vicepresidente de redes de NVIDIA, destacó la importancia de esta plataforma para la misión de xAI: “La inteligencia artificial se está convirtiendo en un componente crítico para el futuro y requiere rendimiento, seguridad y escalabilidad. Con Spectrum-X, estamos proporcionando a xAI una plataforma capaz de acelerar el procesamiento y la comercialización de sus soluciones de IA”.

Declaraciones de Musk y objetivos de xAI

Elon Musk, a través de su cuenta en X, fue directo al declarar que “Colossus es el sistema de entrenamiento más potente del mundo. Buen trabajo del equipo de xAI, NVIDIA y nuestros numerosos socios y proveedores”. Un portavoz de xAI añadió que “NVIDIA Hopper y Spectrum-X nos permiten llevar los límites del entrenamiento de modelos a gran escala, creando una fábrica de IA superacelerada basada en Ethernet”.

La visión de xAI es crear una plataforma de inteligencia artificial ultraoptimizada que permita a sus modelos Grok ser competitivos en los más altos niveles de rendimiento. La ampliación de Colossus, sumada a la infraestructura avanzada de Spectrum-X, coloca a xAI en una posición única en el ecosistema de IA, ofreciendo una alternativa estadounidense potente a las soluciones de entrenamiento de modelos proporcionadas por gigantes como Google y Microsoft.

Próximos desafíos y récord en el horizonte

El despliegue de las nuevas GPUs en Colossus marca un desafío sin precedentes en términos de instalación y coordinación de hardware. En las próximas semanas, NVIDIA y xAI buscarán batir el récord de tiempo de instalación de 19 días establecido en la primera fase del proyecto, lo que captará la atención del sector y reafirmará a xAI como un actor clave en la inteligencia artificial.

La ampliación de Colossus no solo subraya el compromiso de Musk y xAI por liderar en la carrera de IA, sino que establece un nuevo estándar en capacidad de procesamiento y rapidez de implementación en el desarrollo de superordenadores de inteligencia artificial.

fuente: Revista cloud

Scroll al inicio