El 5 de agosto de 2025, OpenAI anunció el lanzamiento de sus modelos GPT-OSS, que ahora se encuentran disponibles en AWS mediante Amazon SageMaker AI y Amazon Bedrock. Estos modelos, gpt-oss-20b y gpt-oss-120b, representan una evolución significativa en las arquitecturas de Transformer, entrenadas exclusivamente con texto y mejoradas por la tecnología Mixture-of-Experts (MoE), que optimiza el uso de los recursos computacionales al activar solo una fracción de los parámetros necesarios por token.
Los modelos GPT-OSS destacan especialmente en tareas avanzadas como programación, análisis científico y razonamiento matemático. Una de sus características más destacadas es la longitud de contexto de 128,000 tokens, además de ofrecer niveles de razonamiento ajustables y estructurados.
De acuerdo con la documentación de OpenAI, estos modelos han pasado por un riguroso entrenamiento centrado en la seguridad y pruebas de afinamiento adversarial, con el fin de fortalecer su robustez frente a usos indebidos. La facilidad de implementación es otro de sus atractivos, ya que pueden utilizarse directamente a través de Amazon SageMaker JumpStart o mediante las API de Amazon Bedrock.
Una de las ventajas clave del GPT-OSS es su capacidad de afinamiento, lo que permite ajustar los pesos de un modelo preentrenado utilizando conjuntos de datos específicos, adaptando el rendimiento del modelo a necesidades particulares sin necesidad de reiniciar el proceso de entrenamiento desde cero.
Además, el entorno completamente gestionado para afinar estos modelos incluye diversas herramientas de código abierto, que facilitan la distribución del entrenamiento en múltiples GPUs. La utilización de la técnica de optimización DeepSpeed ZeRO-3 permite reducir significativamente el uso de memoria, posibilitando el entrenamiento eficiente de modelos con miles de millones de parámetros.
En el ámbito empresarial, la versatilidad de los modelos GPT-OSS los convierte en una opción ideal para tareas que requieren razonamiento en múltiples idiomas, lo cual es esencial para empresas que buscan operar de manera eficaz en varios contextos lingüísticos. Estos modelos están diseñados para ser implementados rápida y fácilmente, ajustándose a necesidades específicas, lo que los transforma en activos valiosos para la innovación y la automatización.
En resumen, OpenAI ha dado un paso notable con la introducción de sus modelos GPT-OSS, proporcionando soluciones de inteligencia artificial avanzadas que se integran fácilmente en los flujos de trabajo empresariales, potenciando la capacidad de análisis y razonamiento en diversos idiomas.