OpenAI ha presentado un conjunto de herramientas diseñadas para facilitar la creación y escalabilidad de agentes inteligentes, optimizando la compleja lógica de orquestación que requieren estas aplicaciones. La compañía busca que los desarrolladores puedan integrar de manera más sencilla funcionalidades avanzadas en sus sistemas.
Presentación de la Responses API
Una de las principales novedades es la Responses API, una nueva API que combina las ventajas de las anteriores Chat Completions y Assistants APIs. Diseñada para ser más intuitiva, esta herramienta permite la integración de funcionalidades de OpenAI de manera automatizada, ejecutando llamadas a herramientas y agregando resultados al contexto conversacional de forma nativa.
Según OpenAI, a medida que las capacidades de los modelos evolucionen, la Responses API proporcionará una base más flexible para el desarrollo de aplicaciones basadas en agentes.
Nuevas herramientas para mejorar la utilidad de los agentes
Entre las innovaciones destacadas, OpenAI ha incorporado herramientas específicas para mejorar el rendimiento y la eficiencia de los agentes inteligentes:
- Búsqueda web: Ahora es posible acceder a respuestas precisas y con citas claras desde la web, utilizando la misma tecnología que ChatGPT emplea en sus consultas en línea. Esta funcionalidad puede integrarse con solo unas pocas líneas de código y está disponible en la Responses API para los modelos gpt-4o y gpt-4o-mini. Además, en la Chat Completions API se ofrece como un modelo independiente bajo los nombres gpt-4o-search-preview y gpt-4o-mini-search-preview.
- Búsqueda en archivos: Una herramienta de recuperación de información que facilita la búsqueda de datos en archivos, con compatibilidad para múltiples formatos. Incluye capacidades de reorganización, filtrado por atributos y reescritura de consultas. Disponible tanto en la Responses API como en la Assistants API.
- Uso de ordenadores: Permite construir agentes capaces de operar ordenadores o máquinas virtuales, utilizando el modelo CUA (Computer Use API). Esta tecnología, la misma que impulsa el operador de ChatGPT, permite interpretar capturas de pantalla y determinar las acciones adecuadas, como hacer clic, desplazarse o escribir. Actualmente, esta funcionalidad está disponible para desarrolladores seleccionados en una fase de investigación preliminar dentro de la Responses API.
- Agents SDK: Se trata de un marco de orquestación que simplifica el diseño y la escalabilidad de agentes, incorporando herramientas de observabilidad para registrar, visualizar y analizar el rendimiento de los sistemas. Inspirado en Swarm, el Agents SDK es de código abierto y permite la integración con otros modelos y proveedores de seguimiento.
Recompensas por ayudar a mejorar los modelos de OpenAI
Como incentivo para mejorar la calidad de sus modelos, OpenAI ofrece tokens gratuitos a desarrolladores que contribuyan proporcionando indicaciones, respuestas y trazas de interacción. Las organizaciones elegibles podrán recibir hasta 1 millón de tokens diarios en modelos como gpt-4.5-preview, gpt-4o y o1, y hasta 10 millones de tokens diarios en gpt-4o-mini, o1-mini y o3-mini. La oferta estará disponible hasta finales de abril, y los desarrolladores podrán verificar su elegibilidad a través de su panel de control.
Con este lanzamiento, OpenAI refuerza su compromiso con la innovación en la inteligencia artificial, facilitando a los desarrolladores herramientas más potentes y accesibles para la creación de agentes inteligentes.