OpenAI abre GPT-4 API y retira los modelos basados en GPT-3

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

OpenAI ha abierto el acceso a la API de GPT-4 para todos sus clientes con historial de pago activo, eliminando la lista de espera que hasta ahora limitaba su uso. La versión de 32.000 tokens de contexto queda excluida de este lanzamiento general por el momento, pero la empresa planea ampliar cuotas conforme aumenta la disponibilidad de recursos de cómputo.

Al mismo tiempo, OpenAI ha declarado oficialmente legada la API de Completions en favor de Chat Completions. La razón es directa: Chat Completions ya representa el 97% del uso total de la API GPT, según datos internos de la compañía. La interfaz de chat soporta mensajes de sistema, llamadas a funciones y conversaciones de varios turnos, y reduce la exposición a ataques de inyección de instrucciones al separar el contenido del usuario de las instrucciones del sistema.

También se ha puesto a disposición general la API de GPT-3.5 Turbo, junto con DALL·E y Whisper.

Calendario de retirada de modelos GPT-3

La compañía ha fijado el 4 de enero de 2024 como fecha límite para migrar los modelos más antiguos. Las aplicaciones que usen los nombres base de los modelos GPT-3 (ada, babbage, curie, davinci) serán actualizadas automáticamente a sus equivalentes de nueva generación: ada-002, babbage-002, curie-002 y davinci-002. Los desarrolladores que usen versiones como text-davinci-003 deberán cambiar manualmente a gpt-3.5-turbo-instruct, un modelo comparable a InstructGPT entrenado de forma similar.

Los modelos de embeddings antiguos (como text-search-davinci-doc-001) quedarán sustituidos por text-embedding-ada-002, que ya concentra el 99,9% del uso de la API de embeddings. OpenAI se comprometió a cubrir el coste de re-embedizar el contenido existente para los usuarios afectados. La API de Edits, por su parte, también desaparece; sus funciones han sido integradas en GPT-3.5 Turbo y Chat Completions.

Los desarrolladores con modelos ajustados (fine-tuned) sobre las versiones antiguas tendrán que entrenar de nuevo sobre los nuevos modelos base o sobre GPT-3.5 Turbo. OpenAI anunció acceso prioritario al fine-tuning de GPT-3.5 Turbo y GPT-4 para quienes ya hayan ajustado modelos anteriores. Los retos de integrar modelos de lenguaje en aplicaciones reales van mucho más allá de la elección del modelo: el contexto, la latencia y la gestión de versiones son igual de críticos.

Fine-tuning para GPT-4 y GPT-3.5 Turbo

OpenAI anunció que el fine-tuning para GPT-4 y GPT-3.5 Turbo llegaría más adelante en 2023, aunque sin fecha concreta. La posibilidad de ajustar estos modelos con datos propios es una de las funciones más demandadas por equipos que necesitan adaptar el comportamiento del modelo a dominios específicos sin depender de prompts extensos.

El cambio de estrategia refleja una apuesta clara: simplificar la API en torno a un único paradigma de chat. Mantener dos sistemas paralelos, uno de completions y otro de chat, genera fragmentación en la documentación y complica el soporte. El coste de acceso a los modelos más capaces sigue siendo un factor a tener en cuenta para equipos con volumen alto de peticiones. La factura real de la IA en producción rara vez coincide con lo que sugieren los planes de entrada.

Preguntas frecuentes

¿Qué ocurrió con la API de Completions de OpenAI?

OpenAI la declaró legada en julio de 2023 y comenzó a orientar a los desarrolladores hacia Chat Completions, que ya concentraba el 97% del uso. Los modelos asociados quedaron reemplazados en enero de 2024.

¿Qué modelos GPT-3 fueron retirados?

Los modelos ada, babbage, curie y davinci dejaron de estar disponibles el 4 de enero de 2024, sustituidos por ada-002, babbage-002, curie-002 y davinci-002. text-davinci-003 se migró a gpt-3.5-turbo-instruct.

¿Hay que pagar para usar la API de GPT-4?

Sí. Desde julio de 2023, el acceso quedó abierto a todos los clientes de OpenAI con historial de pago activo, sin lista de espera. La versión de 32K tokens requiere solicitud adicional.

¿Qué pasó con los embeddings de los modelos antiguos?

OpenAI pidió migrar a text-embedding-ada-002 antes del 4 de enero de 2024 y se comprometió a cubrir los costes de re-embedización del contenido existente para los usuarios afectados.

¿Cuándo llegó el fine-tuning de GPT-4?

El anuncio de julio de 2023 lo dejó como función pendiente para más adelante en el año. OpenAI prometió prioridad a los usuarios que ya tuvieran modelos ajustados sobre versiones anteriores.