OpenAI ha anunciado la apertura del API de GPT-4 y ha dejado obsoletas todas sus API anteriores. Esta nueva versión ya no requerirá una lista de espera, aunque por ahora no incluirá la versión de 32K. Además, en enero de 2024, eliminará los sistemas antiguos (davincis, curies, adas, etc.) basados en GPT-3.
La API de GPT-4 ahora está disponible para todos los clientes de pago. En marzo, OpenAI presentó la API de ChatGPT y, a principios de este mes, lanzó las primeras actualizaciones de los modelos basados en chat. La visión de OpenAI es que los modelos basados en chat puedan adaptarse a cualquier caso de uso. Por ello, anuncian un plan de obsolescencia para los modelos antiguos de la API de Completions, recomendando a los usuarios que adopten la API de Chat Completions.
GPT-4 es el modelo más avanzado de OpenAI. Desde marzo, millones de desarrolladores han solicitado acceso a la API de GPT-4, y cada día se están desarrollando productos innovadores que aprovechan sus capacidades. A partir de hoy, todos los desarrolladores existentes con un historial de pagos exitosos pueden acceder a la API de GPT-4 con un contexto de 8K. OpenAI tiene previsto abrir el acceso a nuevos desarrolladores antes de que finalice este mes y, posteriormente, aumentar los límites de uso en función de la disponibilidad de recursos informáticos.
Basándose en la estabilidad y la preparación de estos modelos para su uso a escala de producción, OpenAI también ha puesto a disposición de manera general la API de GPT-3.5 Turbo, DALL·E y Whisper. Además, están trabajando en habilitar de forma segura el ajuste fino (fine-tuning) para GPT-4 y GPT-3.5 Turbo, y esperan que esta función esté disponible más adelante este año.
OpenAI ha decidido cambiar su enfoque de las completions de texto a las completions de chat. En marzo, introdujeron la API de Chat Completions, que ahora representa el 97% del uso total de la API GPT. Se ha comprobado que este enfoque basado en chat es muy potente y puede abordar la mayoría de los casos de uso anteriores y nuevas necesidades conversacionales, al tiempo que ofrece una mayor flexibilidad y especificidad. La API de Chat Completions cuenta con una interfaz estructurada que permite mensajes del sistema y llamadas a funciones, y puede manejar conversaciones de varios turnos. Además, reduce el riesgo de ataques de inyección de instrucciones, ya que separa de manera estructural el contenido proporcionado por el usuario de las instrucciones.
Como parte de los esfuerzos de optimización y para mejorar su capacidad informática, OpenAI planea retirar algunos de los modelos antiguos que utilizan la API de Completions. Si bien esta API seguirá siendo accesible, a partir de hoy se la etiquetará como «legada» en la documentación para desarrolladores. A partir del 4 de enero de 2024, los modelos de completions antiguos serán reemplazados.
Las aplicaciones que utilizan los nombres estables de los modelos base GPT-3 (ada, babbage, curie, davinci) se actualizarán automáticamente a los nuevos modelos mencionados el 4 de enero de 2024. Además, los nuevos modelos estarán disponibles en las próximas semanas para pruebas tempranas al especificar los nombres correspondientes en las llamadas a la API: ada-002, babbage-002, curie-002, davinci-002.
Los desarrolladores que utilizan otros modelos antiguos de completions (como text-davinci-003) deberán actualizar manualmente su integración antes del 4 de enero de 2024, especificando gpt-3.5-turbo-instruct en el parámetro «model» de sus solicitudes a la API. gpt-3.5-turbo-instruct es un modelo similar a InstructGPT, entrenado de manera similar a text-davinci-003. Este nuevo modelo es una opción compatible en la API de Completions y estará disponible en las próximas semanas para pruebas tempranas.
Los desarrolladores que deseen seguir utilizando sus modelos ajustados a partir del 4 de enero de 2024 deberán realizar ajustes adicionales en los nuevos modelos base de GPT-3 (ada-002, babbage-002, curie-002, davinci-002) o en modelos más nuevos (gpt-3.5-turbo, gpt-4). Una vez que esta función esté disponible más adelante este año, se dará acceso prioritario al ajuste fino de GPT-3.5 Turbo y GPT-4 a los usuarios que hayan ajustado modelos antiguos previamente. OpenAI reconoce que migrar modelos ajustados con datos propios puede ser desafiante y proporcionará soporte a los usuarios para que esta transición sea lo más fluida posible.
En las próximas semanas, OpenAI se pondrá en contacto con los desarrolladores que hayan utilizado recientemente estos modelos antiguos y proporcionará más información una vez que los nuevos modelos de completions estén listos para pruebas tempranas.
Además, se informa que los usuarios de modelos antiguos de embeddings (por ejemplo, text-search-davinci-doc-001) deberán migrar a text-embedding-ada-002 antes del 4 de enero de 2024. OpenAI ha lanzado text-embedding-ada-002 en diciembre de 2022 y ha demostrado ser más capaz y rentable que los modelos anteriores. Actualmente, text-embedding-ada-002 representa el 99,9% de todo el uso de la API de embeddings. OpenAI reconoce que este cambio es significativo para los desarrolladores que utilizan esos modelos antiguos y se compromete a cubrir los costos financieros asociados con la re-embedización del contenido utilizando los nuevos modelos. OpenAI se pondrá en contacto con los usuarios afectados en los próximos días.
Por último, la API de Edits y los modelos asociados (como text-davinci-edit-001 o code-davinci-edit-001) se eliminarán gradualmente. Se recomienda a los desarrolladores que migren a GPT-3.5 Turbo antes del 4 de enero de 2024. La API de Edits, que permitía la modificación de las instrucciones, se ha integrado en la funcionalidad de GPT-3.5 Turbo y la API de Chat Completions, que ahora se pueden utilizar con el mismo propósito.
La apertura del API de GPT-4 y la retirada de modelos antiguos demuestran el compromiso de OpenAI en el avance de los modelos de lenguaje y en proporcionar a los desarrolladores herramientas más eficientes y poderosas. El enfoque en las completions de chat y la obsolescencia de las API antiguas son acordes con el objetivo de OpenAI de ofrecer una experiencia cada vez más capaz y amigable para los usuarios. Los desarrolladores pueden esperar futuras actualizaciones y mejoras a medida que OpenAI continúa perfeccionando sus modelos de lenguaje y explorando nuevas posibilidades.