Meta lanza Llama 2: LLM open source con licencia comercial

Meta ha publicado Llama 2, la segunda versión de su modelo de lenguaje de gran escala, con acceso abierto y licencia comercial. El lanzamiento se hizo en un evento conjunto con Microsoft, que distribuye el modelo en Azure desde el primer día. Hugging Face y AWS también tienen previsto incorporarlo a sus plataformas.

Llama 2 está disponible en tres tamaños: 7.000, 13.000 y 70.000 millones de parámetros. Cada tamaño incluye una versión del modelo base y una versión de chat ajustada con datos de conversación. Meta publica los pesos del modelo, lo que permite descargarlo, ejecutarlo localmente o ajustarlo sobre datos propios. La licencia, a diferencia de Llama v1, admite uso comercial salvo para plataformas con más de 700 millones de usuarios activos mensuales.

La diferencia con Llama v1

Llama v1 se publicó en febrero de 2023 con acceso restringido a investigadores y una licencia que no permitía uso comercial. A pesar de eso, el modelo se filtró a internet y generó una cascada de proyectos que exploraron sus capacidades. Llama 2 recoge esa experiencia: la licencia es más abierta, la distribución está integrada en Azure y Hugging Face desde el primer día, y los benchmarks muestran mejoras respecto a la versión anterior.

Rendimiento comparado

Según el paper publicado por Meta, Llama 2 Chat 70B supera a otros modelos abiertos en la mayoría de los benchmarks evaluados e iguala en rendimiento a GPT-3.5 en varios tests. El paper usa evaluaciones como MMLU, TruthfulQA y HellaSwag como métricas de referencia. En el 70% de las comparaciones directas frente a modelos alternativos, Llama 2 obtiene resultados iguales o superiores.

Comparativa de modelos LLM: winrate Llama 2 frente a alternativas

Qué cambia para el mercado

La publicación de Llama 2 con licencia comercial mueve el tablero del sector. Microsoft, que tiene una inversión significativa en OpenAI, ahora también distribuye un modelo que compite directamente con los de esa misma compañía a través de Azure. Para cualquier equipo que quiera ajustar un modelo sobre sus propios datos sin pagar por una API externa, Llama 2 se convierte en la opción más madura del momento. Los retos de integrar modelos de IA en aplicaciones reales siguen siendo los mismos, pero ahora el punto de partida es más accesible.

OpenAI y Google se enfrentan a un mercado donde un modelo comparable en rendimiento a GPT-3.5 está al alcance de cualquier empresa con infraestructura suficiente. Meta, que ha publicado en abierto gran parte de su investigación en los últimos años, consolida así una estrategia diferente a la de sus competidores. Qué son exactamente los LLMs y cómo funcionan es una pregunta que cobra más sentido ahora que cualquier empresa puede ejecutar uno.

La arquitectura, los pesos y las instrucciones de ajuste fino están disponibles en el repositorio oficial de Llama.

Preguntas frecuentes

¿Llama 2 es gratuito?

Sí para la mayoría de los casos de uso. La licencia permite uso comercial sin coste salvo para plataformas con más de 700 millones de usuarios activos mensuales.

¿Cuáles son los tamaños disponibles de Llama 2?

7B, 13B y 70B parámetros. Cada uno disponible en versión base y versión chat (ajustada para conversaciones por instrucción).

¿Dónde se puede descargar Llama 2?

En la web oficial de Meta AI, en Hugging Face y a través de Azure AI de Microsoft. El repositorio incluye los pesos del modelo y la documentación de uso.

¿Cómo se compara Llama 2 con GPT-3.5?

Según el paper de Meta, Llama 2 Chat 70B iguala en rendimiento a GPT-3.5 en varios benchmarks (MMLU, TruthfulQA). En español su comportamiento es más variable al haber sido entrenado principalmente sobre texto en inglés.

¿Por qué colabora Meta con Microsoft en este lanzamiento?

Microsoft distribuye Llama 2 en Azure desde el primer día. Esto diversifica la cartera de modelos de la plataforma cloud y reduce la dependencia exclusiva de los modelos de OpenAI, en los que Microsoft tiene una inversión multimillonaria.

Scroll al inicio