Mistral desafía a Meta con el lanzamiento de su modelo IA Large 2

Un día después de que Meta revelara su modelo de IA más grande hasta la fecha, Llama 3.1, la startup francesa respaldada por Microsoft, Mistral, ha presentado su modelo más avanzado: Large 2. Este nuevo modelo promete estar a la par con el GPT-4o de OpenAI y el Llama 3.1 de Meta, superando incluso al Claude 3.5 Sonnet de Anthropic en rendimiento, al tiempo que ofrece beneficios de costo debido a su menor tamaño.

Capacidades Multilingües y de Programación

Large 2 destaca por sus avanzadas capacidades multilingües, entendiendo idiomas como árabe, hindi, chino, japonés y coreano. En pruebas de referencia, obtuvo la misma puntuación que Llama 3.1 en esta área. Además, puede entender más de 80 lenguajes de programación y posee capacidades matemáticas avanzadas, superando al Claude 3.5 Sonnet de Anthropic y quedando en un cercano segundo lugar respecto al GPT-4o en generación de código y pruebas matemáticas.

Precisión y Concisión Mejoradas

Mistral ha ajustado Large 2 para que siga mejor las instrucciones y proporcione respuestas más concisas. Para reducir las «alucinaciones» típicas de los modelos de IA, Large 2 ha sido afinado para ser más selectivo, indicando al usuario cuando no conoce una respuesta en lugar de fabricarla.

Modelo Abierto y Accesibilidad

Large 2 es de código abierto para usos no comerciales, a diferencia del GPT-4o. Sin embargo, los usuarios deben pagar para utilizarlo con fines comerciales, a diferencia de Llama 3.1, que es completamente de código abierto. Es importante señalar que, al igual que Llama 3.1, Large 2 no tiene capacidades multimodales, lo que significa que solo puede manejar texto, a diferencia de GPT-4o que puede procesar imágenes, audio y video.

Comparación de Modelos

El lanzamiento de Large 2 plantea una interesante comparación en términos de rendimiento y costo entre los principales modelos de IA disponibles en el mercado.

  • Meta’s Llama 3.1: Totalmente de código abierto, sin capacidades multimodales.
  • OpenAI’s GPT-4o: Modelo más versátil con capacidades multimodales.
  • Mistral’s Large 2: Ofrece un equilibrio entre rendimiento y costo, con fuertes capacidades multilingües y de programación, pero limitado a uso de texto.

Conclusión

Con la competencia intensificándose en el campo de la IA, el lanzamiento de Large 2 por parte de Mistral destaca como un contendiente fuerte que promete ofrecer un rendimiento competitivo a un costo más bajo. La elección entre estos modelos dependerá de las necesidades específicas de rendimiento y costo de los usuarios.

Últimos artículos

Scroll al inicio