Construyendo Flujo de Trabajo Agente con OpenAI GPT OSS en Amazon SageMaker AI y Amazon Bedrock AgentCore

Elena Digital López

OpenAI ha revolucionado el panorama de la inteligencia artificial con el lanzamiento de dos nuevos modelos de pesos abiertos, gpt-oss-120b y gpt-oss-20b, que han sido diseñados con un enfoque de Mezcla de Expertos (MoE) y una ventana de contexto de 128K. Estos modelos, poseedores de 117 mil millones y 21 mil millones de parámetros respectivamente, han alcanzado la cima en el ámbito de los modelos de código abierto, sobresaliendo en benchmarks de analistas por su destreza en tareas de razonamiento y flujos de trabajo dinámicos.

Mediante el uso de Amazon SageMaker AI, los usuarios tienen la posibilidad de personalizar y afinar estos modelos, además de desplegarlos usando su marco preferido en un servicio completamente gestionado. La plataforma ofrece la flexibilidad de incorporar código de inferencia propio sin la necesidad de construir y mantener extensos clústeres, lo que simplifica enormemente el proceso.

Mientras que los grandes modelos de lenguaje (LLMs) han demostrado ser sobresalientes en la comprensión del lenguaje y la generación de contenido, la creación de aplicaciones autónomas del mundo real conlleva la gestión compleja de flujos de trabajo, capacidades de llamada a herramientas y gestión de contextos. Las arquitecturas de múltiples agentes se presentan como una solución idónea, permitiendo descomponer sistemas complicados en componentes específicos, aunque también presentan el desafío de coordinar y orquestar eficientemente estos agentes.

Recientemente, se publicó un artículo que detalla cómo desplegar el modelo gpt-oss-20b en endpoints gestionados de SageMaker. Se describe un asistente analizador de acciones, creado con LangGraph, un marco basado en gráficos que maneja la gestión de estado y flujos coordinados. Luego, los agentes se implementan en Amazon Bedrock AgentCore, brindando una capa de orquestación unificada que abstrae la infraestructura, facilitando la operación segura y a gran escala de agentes de IA.

La solución propuesta consiste en un analizador de acciones que integra el modelo GPT OSS 20B en un endpoint de SageMaker usando vLLM, LangGraph para la orquestación de múltiples agentes, y Amazon Bedrock AgentCore para el despliegue ágil de agentes. Esta arquitectura permite a los usuarios realizar consultas que son procesadas por un conjunto de agentes especializados en evaluar acciones.

Además, se ofrece una guía detallada sobre la configuración de entornos, gestión de permisos y despliegues eficaces, destacando la utilidad de herramientas como vLLM y Amazon Elastic Container Registry para un hospedaje sin contratiempos. Estas innovaciones reducen el tiempo necesario para el análisis de acciones y aumentan la productividad al automatizar tareas rutinarias, permitiendo que analistas se enfoquen en estrategias y complejidades empresariales de mayor envergadura.

Finalmente, se invita a los usuarios a explorar ejemplos de código y mejorar flujos de trabajo de agentes para ajustarse a diversos casos prácticos, subrayando el potencial transformador de los modelos de código abierto en la optimización de procesos y en la mejora de la eficiencia operativa.

Scroll al inicio