OpenAI lanza sus modelos más avanzados: o3 y o4-mini, capaces de razonar con imágenes y usar herramientas

La compañía presenta sus sistemas más potentes hasta la fecha, diseñados para procesar información visual, ejecutar tareas complejas y mejorar la precisión en ciencia, programación y matemáticas.

OpenAI ha anunciado este martes el lanzamiento de sus nuevos modelos de inteligencia artificial o3 y o4-mini, las versiones más avanzadas hasta ahora dentro de su serie «o». Según la compañía, estas herramientas representan un salto cualitativo en capacidades de razonamiento, acceso a herramientas externas y procesamiento multimodal, permitiendo a ChatGPT resolver problemas más complejos con mayor velocidad y precisión.

Potencia y precisión sin precedentes

El modelo o3 destaca como el sistema más capaz de OpenAI hasta la fecha, superando a sus predecesores en pruebas de programación (Codeforces, SWE-bench), razonamiento matemático (AIME 2024, AIME 2025) y análisis visual (MMMU, MathVista). En evaluaciones internas, comete un 20% menos de errores graves que o1 en tareas complejas, especialmente en campos como ingeniería, biología y consultoría empresarial.

Por su parte, o4-mini es una versión más ligera pero altamente eficiente, diseñada para ofrecer respuestas rápidas y económicas sin sacrificar precisión. En la prueba AIME 2025, alcanzó un 99,5% de aciertos al combinarse con un intérprete de Python, superando incluso a modelos más grandes sin acceso a herramientas externas.

Razonamiento visual y uso de herramientas

Una de las novedades más destacadas es la capacidad de ambos modelos para «pensar con imágenes», interpretando diagramas, gráficos o fotografías aunque sean borrosas o de baja calidad. Esto les permite resolver problemas que hasta ahora eran inaccesibles, como analizar esquemas científicos o generar predicciones basadas en datos visuales.

Además, ambos sistemas pueden utilizar herramientas externas de forma autónoma: búsqueda en internet, ejecución de código Python, generación de imágenes o análisis de documentos. Por ejemplo, ante una pregunta como «¿Cómo será el consumo energético en California este verano?», el modelo puede buscar datos públicos, crear un gráfico predictivo y explicar los factores clave, todo en menos de un minuto.

Seguridad y acceso

OpenAI asegura que ha reforzado los protocolos de seguridad, con nuevos filtros para evitar riesgos en áreas como ciberseguridad, bioamenazas o intentos de «jailbreak». Según sus evaluaciones, o3 y o4-mini se mantienen por debajo del umbral de «alto riesgo» en las tres categorías del Marco de Preparación de la empresa.

Los modelos estarán disponibles desde hoy para usuarios de ChatGPT Plus, Pro y Team, mientras que las versiones Enterprise y Edu los incorporarán en una semana. Los desarrolladores también pueden acceder a ellos mediante la API de OpenAI.

El futuro: IA más conversacional y autónoma

Este lanzamiento refuerza la estrategia de OpenAI de combinar el razonamiento especializado de la serie «o» con las habilidades conversacionales de los modelos GPT. La compañía avanza hacia sistemas que ejecuten tareas de forma proactiva, integrando herramientas y conocimientos en tiempo real para ofrecer respuestas más útiles y personalizadas.

Con o3 y o4-mini, OpenAI no solo mejora su tecnología, sino que también redefine lo que los asistentes de IA pueden lograr.

fuente: OpenAI

Scroll al inicio