Nuevos Modelos de OpenAI en GPUs RTX

NVIDIA y OpenAI han dado un paso significativo en el mundo de la inteligencia artificial al optimizar los nuevos modelos de código abierto gpt-oss específicamente para las GPU de NVIDIA. Estos modelos, diseñados para ofrecer un rendimiento rápido e inteligente desde la nube hasta el PC, prometen revolucionar aplicaciones de IA como la búsqueda web y la investigación profunda.

Con el reciente lanzamiento de los modelos gpt-oss-20b y gpt-oss-120b, OpenAI ha puesto al alcance de millones de usuarios lo último en tecnología de IA. Los entusiastas y desarrolladores ahora pueden ejecutar estos modelos optimizados en PCs RTX AI y estaciones de trabajo a través de herramientas populares como Ollama, llama.cpp y Microsoft AI Foundry Local. La expectativa es lograr un rendimiento de hasta 256 tokens por segundo en la GPU NVIDIA GeForce RTX 5090.

Jensen Huang, fundador y CEO de NVIDIA, destacó que estos modelos permiten a los desarrolladores de todo el mundo construir sobre una base de código abierto de última generación, fortaleciendo el liderazgo tecnológico de EE. UU. en el ámbito de la inteligencia artificial. El lanzamiento además subraya el liderazgo de NVIDIA en el área de la IA, desde el entrenamiento hasta la inferencia, y desde la nube hasta el PC.

Ambos modelos, el gpt-oss-20b y el gpt-oss-120b, son flexibles y poseen capacidades de razonamiento de «cadena de pensamiento» y niveles de esfuerzo de razonamiento ajustables gracias a la arquitectura de mezcla de expertos. Estos modelos fueron entrenados usando GPUs H100 de NVIDIA, y pueden manejar hasta 131,072 longitudes de contexto, lo que los hace ideales para tareas complejas como la búsqueda web y la comprensión de documentos.

La manera más sencilla de probar estos modelos en PCs RTX AI, para GPUs con al menos 24GB de VRAM, es usando la nueva aplicación Ollama, muy popular entre los desarrolladores y entusiastas de la IA por su facilidad de integración. Con esta aplicación, los usuarios pueden rápidamente entablar conversaciones con los modelos y disfrutar del poder de la IA personal en sus dispositivos sin configuraciones adicionales.

Además de Ollama, los modelos gpt-oss también pueden ser utilizados a través de otras aplicaciones y marcos en PCs con GPUs RTX de al menos 16GB de VRAM. NVIDIA sigue colaborando con la comunidad de código abierto para optimizar el rendimiento en sus GPUs, como se ha visto con las mejoras en la biblioteca de tensores GGML y la implementación de gráficos CUDA.

Desarrolladores que usen Windows también tienen la opción de acceder a estos nuevos modelos a través de Microsoft AI Foundry Local, una solución de inferencia de IA integrada en los flujos de trabajo. Esta facilidad supone un nuevo avance para los entusiastas y desarrolladores que buscan añadir capacidades de razonamiento a sus aplicaciones aceleradas con IA en Windows.

Con este lanzamiento, OpenAI y NVIDIA inician una nueva ola de innovación en inteligencia artificial, ofreciendo a los desarrolladores y usuarios herramientas poderosas para la investigación y el desarrollo de aplicaciones más inteligentes y sofisticadas.
Fuente: Zona de blogs y prensa de Nvidia

Scroll al inicio