DeepSeek-V3: el modelo de IA de código abierto que desafía a los gigantes de la inteligencia artificial
La startup china DeepSeek ha lanzado su último modelo de inteligencia artificial de gran escala, el DeepSeek-V3, que promete revolucionar el panorama de los modelos de lenguaje. Con 671.000 millones de parámetros y utilizando una arquitectura de «mixture-of-experts» (MoE), este modelo supera a competidores como Llama 3.1-405B de Meta y Qwen 2.5-72B en varias pruebas de referencia, acercándose al rendimiento



