Baidu presentó ERNIE 4.0 en el evento Baidu World 2023, celebrado en Pekín el 17 de octubre en formato presencial por primera vez en cuatro años. El modelo llega como respuesta directa a GPT-4 y, según el CTO Haifeng Wang, mejora sus propios resultados en casi un 30% respecto a la beta de septiembre de 2023 en cuatro áreas clave: comprensión, generación, razonamiento y memoria.
La apuesta de Baidu no se limita al modelo en sí. La compañía ha reconstruido con ERNIE 4.0 buena parte de su suite de aplicaciones, desde el buscador principal hasta herramientas de productividad para empresa, lo que da una idea de la escala de integración que plantea.
Qué puede hacer ERNIE 4.0
Robin Li, CEO de Baidu, demostró en directo cuatro capacidades del modelo:
- Comprensión: responde a peticiones complejas que requieren entender contexto e intenciones implícitas.
- Generación: produce contenido variado a partir de una descripción de texto o imagen.
- Razonamiento: resuelve problemas de geometría y lógica formal, área donde los modelos de lenguaje suelen cometer errores.
- Memoria: integra entradas incrementales y mantiene coherencia a lo largo de conversaciones largas.
Baidu no ha publicado benchmarks independientes de ERNIE 4.0 en estándares como MMLU o HumanEval, por lo que la afirmación de igualar a GPT-4 en razonamiento se basa por ahora en evaluaciones propias. Es un patrón habitual en los modelos chinos: los números internos existen, pero la comparación directa con evaluaciones abiertas llega después.
Aplicaciones reconstruidas con IA
- Baidu Search: nueva capa conversacional sobre el buscador principal, con respuestas generadas al estilo de Bing Chat.
- Baidu GBI: asistente de análisis de negocio para acelerar toma de decisiones empresariales.
- Infoflow: plataforma de comunicación y gestión del conocimiento para equipos.
- Baidu Wenku: evoluciona de plataforma documental a herramienta de productividad de contenidos.
- Baidu Drive YunYiduo: asistente en la nube para recuperar y generar contenido.
- Baidu Maps: integración de IA para navegación y planificación de viajes.
La integración de LLM en suites empresariales sigue la misma lógica que otros actores globales: SAP, por ejemplo, ha anunciado que integra Claude de Anthropic en su portafolio de soluciones. Baidu aplica el mismo enfoque, pero en el ecosistema de aplicaciones propias y el mercado chino.
Posición de Baidu en el mercado chino de IA
Baidu fue uno de los primeros en China en poner un chatbot conversacional frente al público (ERNIE Bot, en marzo de 2023), meses antes de que la regulación china sobre IA generativa entrara en vigor en agosto. La competencia interna incluye a Alibaba con Tongyi Qianwen, Tencent con Hunyuan y ByteDance con su propio modelo. En el mercado global, la referencia sigue siendo el ecosistema occidental que describe la guía sobre LLM: GPT-4o, Claude 4, Gemini y Llama son los puntos de comparación que usa el sector.
También en octubre de 2023, Yandex presentó YandexART, su generador de imágenes por difusión en cascada, como parte de la misma tendencia de grandes tecnológicas no occidentales que lanzan modelos propios para reducir la dependencia de las API de OpenAI y Google.
Preguntas frecuentes
¿Qué es ERNIE 4.0?
ERNIE 4.0 es el modelo de lenguaje de Baidu, presentado en octubre de 2023. Mejora al ERNIE 3.5 en comprensión, generación, razonamiento y memoria, y es el motor del chatbot ERNIE Bot y las aplicaciones renovadas de la compañía.
¿ERNIE 4.0 supera a GPT-4?
Baidu afirma que ERNIE 4.0 iguala a GPT-4 en ciertas tareas, pero los datos disponibles son evaluaciones internas. Hasta que haya resultados en benchmarks abiertos como MMLU o HumanEval, la afirmación no se puede verificar de forma independiente.
¿Está disponible ERNIE 4.0 fuera de China?
ERNIE Bot tiene acceso limitado fuera de China. La API está disponible para desarrolladores a través de la plataforma Qianfan, aunque el acceso internacional puede estar sujeto a restricciones regulatorias.
¿Qué es RLHF y por qué lo usa ERNIE 4.0?
RLHF (aprendizaje por refuerzo con retroalimentación humana) es una técnica de ajuste fino donde humanos evalúan y ordenan respuestas del modelo para alinearlo con lo que los usuarios esperan. OpenAI la usó para afinar ChatGPT; Baidu aplica el mismo principio en ERNIE.
Fuente: Baidu, Inc.













