Disponible desde hoy para usuarios de ChatGPT Pro, Enterprise y Team, y pronto para Plus y Edu, Codex promete revolucionar la productividad de los desarrolladores con tareas en paralelo y entornos de ejecución aislados.
OpenAI ha presentado oficialmente Codex, un agente de software en la nube diseñado para actuar como un colaborador de ingeniería digital. Disponible ya como vista previa de investigación para usuarios de ChatGPT Pro, Enterprise y Team, Codex permite asignar tareas de desarrollo como escribir nuevas funciones, corregir errores, responder preguntas sobre el código, e incluso proponer pull requests listos para revisión.
La herramienta está impulsada por codex-1, una variante del modelo OpenAI o3 optimizada específicamente para tareas de ingeniería de software. Según la compañía, Codex ha sido entrenado con técnicas de aprendizaje por refuerzo sobre tareas reales, lo que le permite producir código limpio, seguir instrucciones al detalle y ejecutar pruebas hasta obtener resultados válidos.
¿Cómo funciona Codex?
Codex está disponible desde la barra lateral de ChatGPT. Al asignar tareas de programación, el agente trabaja en un entorno de ejecución aislado, precargado con el repositorio del usuario. Puede leer y editar archivos, ejecutar comandos como linters y test suites, y entregar resultados con evidencia verificable como registros de terminal y salidas de prueba.
Cada tarea se procesa de forma independiente y puede tardar entre 1 y 30 minutos, dependiendo de su complejidad. Una vez finalizada, el agente realiza commits en su entorno, y permite revisar los cambios, solicitar revisiones adicionales o iniciar un pull request hacia GitHub.
Además, Codex puede seguir instrucciones específicas dentro de archivos AGENTS.md en el repositorio, donde los desarrolladores pueden definir comandos, configuraciones y convenciones de estilo.
Comparativas y rendimiento
Según pruebas internas de OpenAI, codex-1 supera ampliamente a sus predecesores, logrando una precisión del 75% en tareas validadas con benchmarks como SWE-Bench Verified. El modelo trabaja con contextos de hasta 192.000 tokens y está afinado para producir código alineado con las preferencias humanas.
Seguridad, aislamiento y ética
Codex se ejecuta completamente dentro de un contenedor seguro en la nube, sin acceso a Internet ni a servicios externos. Solo tiene acceso al repositorio proporcionado por el usuario. Esto previene posibles abusos, como la creación de malware, un riesgo creciente en herramientas de generación de código.
OpenAI afirma que ha entrenado a Codex para detectar y rechazar de forma precisa solicitudes maliciosas, sin entorpecer tareas legítimas como ingeniería de bajo nivel. La compañía ha publicado un anexo en la System Card de o3 que detalla estas medidas de seguridad.
Casos de uso reales
Varios equipos ya están utilizando Codex en el mundo real:
- Cisco evalúa cómo puede acelerar sus ciclos de desarrollo y ayudar a equipos técnicos a ejecutar ideas más ambiciosas.
- Temporal lo usa para depurar, generar pruebas y refactorizar grandes bases de código, sin perder el foco.
- Superhuman permite a los PMs realizar pequeños cambios en el código sin requerir a un ingeniero para cada tarea.
- Kodiak Robotics, empresa de conducción autónoma, lo utiliza para escribir herramientas de debugging y mejorar la cobertura de pruebas.
Codex CLI y versión ligera
OpenAI también ha lanzado una versión más pequeña de codex-1, optimizada para Codex CLI, el agente que se ejecuta directamente en el terminal del usuario. Esta versión, denominada codex-mini-latest, es más rápida y está enfocada en tareas de edición y consultas locales. Se puede usar desde hoy con una cuenta de ChatGPT.
Además, los usuarios Plus y Pro que inicien sesión en Codex CLI podrán acceder a créditos gratuitos de API (5 y 50 dólares respectivamente) durante 30 días.
Disponibilidad y precios
Codex ya está disponible para usuarios de ChatGPT Pro, Team y Enterprise, con planes para extenderlo a usuarios Plus y Edu próximamente. En las primeras semanas, habrá acceso sin coste adicional; luego se introducirán límites por uso y precios flexibles.
Para quienes desarrollen sobre la API con codex-mini-latest, el precio es de 1,50 USD por millón de tokens de entrada y 6 USD por millón de tokens de salida, con un 75% de descuento si se aprovecha el sistema de cacheo de prompts.
Mirando al futuro
OpenAI planea fusionar la colaboración en tiempo real con flujos asincrónicos, para que los desarrolladores puedan asignar tareas a los agentes desde su IDE, ChatGPT Desktop, Codex CLI, o incluso integraciones con gestores de incidencias o CI/CD. También se trabaja en permitir guías durante la ejecución, actualizaciones proactivas y una colaboración más fluida entre humanos y agentes de IA.
La ingeniería de software es una de las primeras industrias en sentir el impacto real de la productividad con IA. Y esto, según OpenAI, “es solo el principio”.
Fuente: OpenAI