Meta celebró el pasado 29 de abril su primera conferencia para desarrolladores de inteligencia artificial, LlamaCon 2025, en su sede de Menlo Park, California. El evento sirvió para presentar oficialmente la familia de modelos Llama 4, que marca un avance significativo en la estrategia de IA de código abierto de la compañía.
Llama 4: arquitectura Mixture-of-Experts y capacidades multimodales
La serie Llama 4 introduce una arquitectura Mixture-of-Experts (MoE), permitiendo una mayor eficiencia al activar solo una fracción de los parámetros durante la inferencia. Los modelos son nativamente multimodales, capaces de procesar entradas de texto e imagen simultáneamente, y ofrecen soporte multilingüe en más de 200 idiomas.
Entre los modelos presentados se encuentran:
- Llama 4 Scout: con 17.000 millones de parámetros activos y una ventana de contexto de 10 millones de tokens, destaca en tareas de resumen de documentos y razonamiento sobre grandes bases de código.
- Llama 4 Maverick: también con 17.000 millones de parámetros activos, pero con 128 expertos, está optimizado para comprensión de texto e imagen, y aplicaciones generales de asistencia y chat.
- Llama 4 Behemoth: aún en fase de entrenamiento, este modelo contará con 288.000 millones de parámetros activos y un total de aproximadamente 2 billones de parámetros, posicionándose como uno de los modelos más potentes desarrollados por Meta.
Herramientas y colaboraciones para la comunidad de desarrolladores
Meta anunció el lanzamiento de la Llama API, diseñada para facilitar la personalización y despliegue de modelos Llama. Además, presentó nuevas herramientas de seguridad como Llama Guard 4, LlamaFirewall y Llama Prompt Guard, enfocadas en mitigar riesgos en sistemas de IA generativa.
La compañía también destacó colaboraciones con empresas como Cerebras y Groq para mejorar la velocidad de inferencia de los modelos, y anunció una iniciativa de subvenciones por valor de 1,5 millones de dólares para apoyar proyectos de IA de código abierto.
Aplicaciones prácticas y visión de futuro
Durante LlamaCon, se presentaron casos de uso reales de Llama 4 en diversas industrias:
- AT&T: utiliza Llama 4 para priorizar tareas de desarrollo interno.
- Kavak: aplica el modelo para ofrecer recomendaciones a compradores de automóviles usados.
- Sofya: una aplicación médica que reduce significativamente el tiempo y esfuerzo de los médicos.
En una conversación con el CEO de Microsoft, Satya Nadella, Mark Zuckerberg enfatizó la importancia de la IA abierta y la colaboración entre empresas para impulsar la innovación y el desarrollo de soluciones que beneficien a la sociedad en su conjunto.
Desafíos y perspectivas
A pesar de los avances presentados, algunos desarrolladores expresaron escepticismo respecto a la capacidad de Llama 4 para igualar el rendimiento de modelos propietarios como GPT-4 o Claude 3.7, especialmente en tareas de razonamiento avanzado y generación de código.
Meta reconoce estos desafíos y continúa trabajando en la mejora de sus modelos, con la expectativa de que Llama 4 Behemoth y futuras versiones puedan cerrar la brecha de rendimiento.
Con una inversión prevista de hasta 65.000 millones de dólares en infraestructura de IA este año, Meta reafirma su compromiso con el desarrollo de una inteligencia artificial abierta, accesible y segura para todos.
vía: Noticias cloud