DeepSeek

DeepSeek-V3: el modelo de IA de código abierto que desafía a los gigantes de la inteligencia artificial

La startup china DeepSeek ha lanzado su último modelo de inteligencia artificial de gran escala, el DeepSeek-V3, que promete revolucionar el panorama de los modelos de lenguaje. Con 671.000 millones de parámetros y utilizando una arquitectura de «mixture-of-experts» (MoE), este modelo supera a competidores como Llama 3.1-405B de Meta y Qwen 2.5-72B en varias pruebas de referencia, acercándose al rendimiento

DeepSeek-R1: el modelo de IA chino que desafía a OpenAI

El laboratorio chino de inteligencia artificial DeepSeek ha revelado una vista previa de su nuevo modelo DeepSeek-R1, el cual ha comenzado a generar comparaciones con el modelo o1 de OpenAI. Según los expertos, DeepSeek-R1 es uno de los primeros modelos de IA orientados al razonamiento capaces de rivalizar con el rendimiento del gigante estadounidense. IA con razonamiento humano: un nuevo

DeepSeek Coder V2: El modelo de código open-source que supera a GPT-4 Turbo

La startup china de inteligencia artificial DeepSeek ha anunciado el lanzamiento de DeepSeek Coder V2, un modelo de lenguaje de código open-source que ha superado a los modelos cerrados más avanzados, incluyendo a GPT-4 Turbo, Claude 3 Opus y Gemini 1.5 Pro. DeepSeek, que ya había llamado la atención con un competidor de ChatGPT entrenado con 2 billones de tokens

Scroll al inicio