En un nuevo paso hacia la democratización de la inteligencia artificial, OpenAI y NVIDIA han anunciado el lanzamiento de dos modelos de razonamiento de inteligencia artificial de código abierto: gpt-oss-120b y gpt-oss-20b. Estos avances están diseñados para poner el desarrollo de IA de última generación al alcance de desarrolladores, empresas, startups y gobiernos, independientemente del sector o la escala.
Esta colaboración entre NVIDIA y OpenAI subraya el potencial de la innovación impulsada por la comunidad y destaca el papel fundamental de NVIDIA para hacer accesible la IA en todo el mundo. Los modelos pueden ser utilizados para desarrollar aplicaciones innovadoras en áreas como la inteligencia artificial generativa, el razonamiento y la inteligencia física. Además, pueden tener un impacto significativo en sectores como la salud y la manufactura, o incluso abrir nuevas industrias a medida que la revolución industrial impulsada por la IA continúa su curso.
Los nuevos modelos de lenguaje de gran tamaño de OpenAI se han entrenado utilizando GPUs NVIDIA H100 y funcionan de manera óptima en la amplia infraestructura de GPUs que operan con la plataforma NVIDIA CUDA a nivel global. Ahora disponibles como microservicios NVIDIA NIM, ofrecen una implementación sencilla en cualquier infraestructura acelerada por GPU, garantizando flexibilidad, privacidad de datos y seguridad de nivel empresarial.
Con optimizaciones de software para la plataforma NVIDIA Blackwell, estos modelos logran un rendimiento óptimo en los sistemas NVIDIA GB200 NVL72, alcanzando 1.5 millones de tokens por segundo y elevando la eficiencia de las inferencias.
Jensen Huang, fundador y CEO de NVIDIA, comentó: “OpenAI mostró al mundo lo que se puede construir con NVIDIA AI — y ahora están impulsando la innovación en software de código abierto. Los modelos gpt-oss permiten a los desarrolladores de todo el mundo construir sobre esa base de código abierto de última generación, fortaleciendo el liderazgo tecnológico de EE. UU. en IA, todo sobre la infraestructura computacional de IA más grande del mundo”.
A medida que los modelos de razonamiento avanzado como gpt-oss generan un volumen exponencial de tokens, la demanda sobre la infraestructura computacional aumenta notablemente. Para satisfacer esta demanda, se requieren fábricas de IA diseñadas específicamente, potenciadas por la arquitectura NVIDIA Blackwell, que ofrece la escala, eficiencia y retorno de inversión necesarios para ejecutar inferencias al más alto nivel.
Este avance promete un desarrollo abierto para millones de constructores de IA alrededor del mundo, con la disponibilidad ampliada de NVIDIA CUDA, la infraestructura de cómputo más accesible a nivel mundial. Desde potentes plataformas en la nube hasta PCs y estaciones de trabajo con sistemas NVIDIA, más de 450 millones de descargas de CUDA ahora pueden beneficiarse de estos modelos optimizados para funcionar con la tecnología NVIDIA que ya utilizan.
La colaboración entre OpenAI y NVIDIA ha trabajado junto con proveedores de marcos de código abierto para proporcionar optimizaciones de modelos para FlashInfer, Hugging Face y otros, permitiendo a los desarrolladores trabajar con el marco de su elección.
Este lanzamiento refleja la historia continua de colaboración entre NVIDIA y OpenAI, una relación que se remonta a 2016, y que ha permitido avances acelerados y más rentables en el terreno de la IA, beneficiando a la vasta comunidad de desarrolladores en todo el mundo.
Fuente: Zona de blogs y prensa de Nvidia