OpenAI ha presentado su última evolución en modelos de inteligencia artificial, denominado o1, marcando un hito significativo en el ámbito de la tecnología avanzada. Este nuevo modelo ha sido desarrollado para emular el proceso de pensamiento humano, permitiendo un análisis más profundo y preciso antes de generar respuestas.
Durante el entrenamiento, el modelo o1 aprende a refinar su pensamiento, explorar diferentes estrategias y detectar errores, lo que le confiere una capacidad de razonamiento comparable a la de estudiantes de doctorado en tareas complejas de física, química y biología. En pruebas recientes, se constató que o1 supera a GPT-4o, la versión anterior, que resolvía correctamente solo el 13% de los problemas en un examen de calificación para la Olimpiada Internacional de Matemáticas (IMO). En contraste, el modelo de razonamiento o1 alcanzó un 83% de aciertos. Además, en competencias de codificación como Codeforces, o1 se posicionó en el percentil 89, destacando su destreza en matemáticas y programación.
A pesar de su avanzado rendimiento en tareas de razonamiento complejo, el modelo o1 aún carece de funcionalidades que hacen a ChatGPT práctico en el día a día, como la navegación web para obtener información o la capacidad de subir archivos e imágenes. Sin embargo, se espera que en el corto plazo, o1 demuestre una mayor capacidad en numerosos casos de uso comunes.
Este lanzamiento representa un avance significativo en las capacidades de la inteligencia artificial, lo que ha llevado a OpenAI a reiniciar su serie de modelos, denominándola OpenAI o1. En paralelo, la empresa ha implementado un novedoso enfoque de entrenamiento en seguridad, aprovechando las capacidades de razonamiento de o1 para adherirse de manera más efectiva a las directrices de seguridad y alineación.
La seguridad del modelo ha sido una prioridad para OpenAI. En pruebas rigurosas para evaluar la resistencia a intentos de eludir las normas de seguridad, conocidas como «jailbreaking», el modelo o1 obtuvo una puntuación de 84 sobre 100, superando significativamente al GPT-4o, que logró solo 22 puntos. Estos resultados se detallan en la tarjeta del sistema y en la publicación de investigación de la empresa.
Para respaldar estas nuevas capacidades, OpenAI ha reforzado sus esfuerzos en seguridad, gobernanza interna y colaboración con el gobierno federal. Esto incluye evaluaciones exhaustivas mediante su Marco de Preparación, sistemas de red teaming de primer nivel y procesos de revisión a nivel de junta, incluyendo la participación del Comité de Seguridad y Protección.
En un esfuerzo por avanzar en el compromiso de OpenAI con la seguridad de la inteligencia artificial, la empresa ha formalizado acuerdos con los Institutos de Seguridad de IA de Estados Unidos y Reino Unido. Estos acuerdos ya están en fase operativa, otorgando a los institutos acceso anticipado a una versión de investigación del modelo o1. Este paso inicial en la colaboración establece un proceso para la investigación, evaluación y pruebas de futuros modelos tanto antes como después de su lanzamiento público.
Con el lanzamiento del modelo o1, OpenAI reafirma su posición a la vanguardia de la innovación en inteligencia artificial, combinando capacidades avanzadas de razonamiento con un robusto marco de seguridad para asegurar un desarrollo ético y responsable de la tecnología.
vía: OpenAI