DeepSeek R2: el nuevo modelo chino que podría revolucionar el mercado de la inteligencia artificial

La inteligencia artificial global podría estar a punto de vivir un nuevo terremoto. Según rumores surgidos en medios chinos y replicados en redes sociales, DeepSeek, la firma tecnológica que ya sorprendió al mundo con su modelo R1, estaría preparando el lanzamiento de DeepSeek R2, un sistema que promete eficiencia récord, menor dependencia de la cadena de suministros estadounidense y unos costes de operación casi irrisorios en comparación con sus competidores occidentales.

Aunque la empresa no ha confirmado oficialmente los datos, las filtraciones apuntan a que el modelo DeepSeek R2 contará con 1,2 billones de parámetros, utilizando una arquitectura híbrida de expertos (Mixture of Experts, MoE), una evolución de los sistemas existentes que combina mecanismos de «gating» avanzados y capas densas para optimizar cargas de trabajo de alto nivel.

Una apuesta disruptiva para el mercado de la IA

La información filtrada sugiere que el R2 sería 97,3 % más barato de operar que GPT-4o de OpenAI. Con un coste estimado de 0,07 dólares por millón de tokens de entrada y 0,27 dólares por millón de tokens de salida, DeepSeek R2 se posicionaría como el modelo de mayor eficiencia económica del mercado, un atractivo irresistible para empresas que buscan soluciones potentes y accesibles.

En cuanto a su entrenamiento, DeepSeek habría optado por una estrategia completamente autónoma, alejándose de la tradicional dependencia de la tecnología estadounidense. El modelo habría sido entrenado en clusters de chips Huawei Ascend 910B, alcanzando una utilización del 82 % de estos procesadores, que proporcionan 512 PetaFLOPS de potencia computacional en precisión FP16. Este movimiento refleja una clara integración vertical de la cadena de suministro de IA en China, un paso estratégico en medio de crecientes tensiones geopolíticas.

Un modelo que supera referencias en visión y evaluación académica

En términos de rendimiento, DeepSeek R2 también promete romper récords: se habla de un 89,7 % de precisión en el benchmark C-Eval 2.0 —utilizado para medir comprensión y razonamiento académico en IA—, y de un impresionante 92,4 % en el benchmark COCO, especializado en tareas de visión artificial.

Estas cifras colocarían al R2 como una alternativa directa y competitiva frente a pesos pesados como GPT-4 Turbo de OpenAI o Gemini 2.0 Pro de Google, a una fracción del coste.

Un cambio de paradigma en la economía de la inteligencia artificial

La potencial irrupción de DeepSeek R2 llega en un momento de alta sensibilidad para el sector tecnológico global. El modelo R1 ya había provocado un impacto en las bolsas estadounidenses tras su lanzamiento, poniendo en duda los costes astronómicos que hasta entonces se consideraban inevitables para entrenar sistemas de IA de alto nivel.

Ahora, con R2, DeepSeek podría reforzar aún más la idea de que no solo es posible competir en calidad, sino también redefinir el modelo económico de la inteligencia artificial, alejándose de la dependencia de gigantes como Nvidia o Amazon Web Services.

Cautela ante los rumores

Pese al entusiasmo generado, expertos y analistas insisten en que toda esta información debe ser tomada con cautela. Hasta el momento, DeepSeek no ha publicado especificaciones oficiales ni fechas de lanzamiento concretas. Los datos, aunque coherentes con la estrategia previa de la empresa, siguen siendo, de momento, especulativos.

De confirmarse, el DeepSeek R2 no solo supondría un hito tecnológico, sino también un golpe de efecto en la carrera por la supremacía en inteligencia artificial, consolidando a China como un actor cada vez más autónomo y competitivo en este sector estratégico.

Mientras tanto, el mundo de la IA aguarda expectante: ¿será el R2 el modelo que cambie para siempre las reglas del juego?

vía: wccftech

Scroll al inicio