Qwen

Elena Digital López

Cómo Ejecutar Qwen 2.5 en Chips de IA de AWS Utilizando Bibliotecas de Hugging Face

En un avance significativo en el campo de los modelos de lenguaje, se han presentado los modelos Qwen 2.5, una colección de modelos generativos preentrenados y ajustados para seguir instrucciones, que vienen en varias configuraciones que van desde 0.5B hasta 72B en cantidad de parámetros. Estos modelos están optimizados para casos de uso de diálogos multilingües, superando tanto a las

Qwen2.5-Max: El modelo de inteligencia artificial que supera a sus competidores

La inteligencia artificial sigue avanzando a pasos agigantados, y la última prueba de ello es el lanzamiento de Qwen2.5-Max, un modelo de inteligencia artificial a gran escala basado en la arquitectura Mixture of Experts (MoE). Desarrollado por el equipo Qwen, este modelo ha sido entrenado con más de 20 billones de tokens y utiliza técnicas avanzadas como el Supervised Fine-Tuning

Scroll al inicio