GPT-4: qué es, cómo funciona y qué lo diferencia de GPT-3.5

GPT-4 es el modelo de lenguaje grande (LLM) que OpenAI publicó el 14 de marzo de 2023. Usa arquitectura Transformer decoder con atención multi-cabeza y se entrena mediante supervisión humana más aprendizaje por refuerzo con retroalimentación de anotadores (RLHF). Frente a GPT-3.5, el salto fue medible en razonamiento, seguimiento de instrucciones complejas y manejo de contexto largo. También fue el primero de la familia GPT en aceptar imágenes como entrada, aunque OpenAI limitó esa función al lanzamiento.

Arquitectura y entrenamiento

OpenAI no publicó el recuento de parámetros. Investigadores externos estiman que supera el billón, repartidos en una arquitectura Mixture of Experts (MoE) donde varios submodelos se activan según la tarea. El preentrenamiento usa texto de fuentes web, libros y código; después llega el ajuste fino supervisado con ejemplos etiquetados por personas y el proceso RLHF para que el modelo prefiera respuestas mejor valoradas. Es el mismo proceso que usó InstructGPT y que hoy siguen prácticamente todos los modelos de asistente.

Comparativa GPT-3 vs GPT-4

Qué mejoró respecto a GPT-3.5

Los benchmarks oficiales documentan la diferencia con precisión. En el examen de abogacía de EE. UU. (Bar Exam), GPT-3.5 quedó en el percentil 10 y GPT-4 alcanzó el percentil 90. En el GRE de redacción analítica, GPT-3.5 logró el percentil 25 frente al 54 de GPT-4. En MMLU (Massive Multitask Language Understanding, con 57 materias académicas), GPT-4 obtuvo 86,4% frente al 70% de su predecesor. En HumanEval, el benchmark de generación de código, el salto fue del 48,1% al 67%.

También mejoró en instrucciones largas y multi-paso, y redujo alucinaciones en dominios especializados, aunque sin eliminarlas. Ningún LLM actual ha resuelto ese problema por completo. Para ver cómo los modelos posteriores siguen atacando ese reto, la comparativa de Claude Mythos frente a METR muestra dónde está el límite actual de la autonomía agéntica.

Capacidades principales

Conversación larga: ChatGPT pasó a usar GPT-4 en la versión Plus desde el lanzamiento. La diferencia más práctica para el usuario fue mantener coherencia en conversaciones con más de 25.000 tokens de contexto efectivo.

Código: GPT-4 puede escribir, depurar y explicar código en decenas de lenguajes. OpenAI desarrolló herramientas como Codex específicamente para programación, aprovechando las capacidades del modelo base.

Visión: GPT-4V, la variante multimodal, acepta imágenes como entrada y puede describirlas, analizarlas o responder preguntas sobre ellas. Se aplicó inicialmente en Be My Eyes, el asistente para personas con discapacidad visual, y después en la API para desarrolladores.

Contexto largo: La variante GPT-4-32k soporta ventanas de 32.000 tokens, suficiente para procesar documentos de varias decenas de páginas en una sola llamada, lo que la hace útil para resumen, extracción de información y análisis legal o médico.

Limitaciones conocidas

GPT-4 tiene fecha de corte de conocimiento (inicialmente septiembre de 2021, ampliada después), así que no sabe nada de lo ocurrido tras esa fecha si no se le da el contexto explícitamente. Hereda también los sesgos de sus datos de entrenamiento, un asunto que analiza el estudio sobre qué webs alimentan a ChatGPT y otros LLM.

El modelo es vulnerable a prompt injection y técnicas de jailbreak, aunque OpenAI ha endurecido los filtros en actualizaciones sucesivas. En cuanto al coste, la API de GPT-4 era al lanzamiento unas 15 veces más cara por token que GPT-3.5, lo que frenó su adopción en productos de bajo margen. Las mejoras de infraestructura de OpenAI, como el protocolo MRC para evitar GPU paradas, apuntan a reducir el coste de inferencia a largo plazo.

GPT-4 hoy: dónde encaja en la familia OpenAI

Desde 2024, OpenAI ha lanzado GPT-4o (multimodal nativo, más rápido y barato), GPT-4o mini (versión ligera), o1 (razonamiento extendido con pensamiento en cadena) y o3. GPT-4 sigue siendo una referencia de lo que se puede conseguir con RLHF y fine-tuning a escala, pero ha quedado atrás en razonamiento complejo respecto a los modelos de la serie o. Para más detalle sobre las decisiones de diseño, el análisis sobre el GPT-4 como sistema avanzado de OpenAI ofrece contexto adicional.

Preguntas frecuentes

¿Cuántos parámetros tiene GPT-4?

OpenAI no ha publicado el dato oficial. Estimaciones externas apuntan a más de un billón de parámetros en una arquitectura Mixture of Experts, sin confirmación por parte de la empresa.

¿En qué se diferencia GPT-4 de GPT-3.5?

Los benchmarks lo documentan: percentil 90 vs 10 en el Bar Exam, 86,4% vs 70% en MMLU y 67% vs 48,1% en HumanEval. GPT-4 añade además capacidades multimodales (imagen + texto) y maneja contextos más largos.

¿Puedo usar GPT-4 gratis?

OpenAI ofrece acceso limitado a GPT-4 en la versión gratuita de ChatGPT. El acceso completo requiere suscripción Plus (20 $/mes) o el uso de la API de pago, con precios por token que varían según la variante del modelo.

¿Es GPT-4 el modelo más avanzado de OpenAI?

No desde 2024. OpenAI ha lanzado GPT-4o, GPT-4o mini, o1 y o3, todos con mejoras en velocidad, coste o capacidad de razonamiento. GPT-4 sigue siendo una referencia técnica, pero no es el modelo más reciente.

¿Cuándo salió GPT-4 y quién tiene acceso?

OpenAI lanzó GPT-4 el 14 de marzo de 2023, inicialmente solo para usuarios de ChatGPT Plus y en lista de espera para la API. El acceso general a la API llegó en julio de 2023. Hoy está disponible tanto en ChatGPT como en la API de OpenAI.

Scroll al inicio