DeepSeek vuelve a tensar el mercado de la inteligencia artificial generativa con una decisión que puede tener más impacto que muchos anuncios de nuevos modelos: hacer permanente la rebaja del 75 % en el precio de su modelo DeepSeek-V4-Pro. La compañía china convierte así una promoción temporal en nueva referencia comercial, con una tarifa API que deja el coste de uso muy por debajo de los modelos más caros de OpenAI, Anthropic o Google.
Según la documentación oficial de DeepSeek, el modelo deepseek-v4-pro queda en 0,003625 dólares por millón de tokens de entrada con caché, 0,435 dólares por millón de tokens de entrada sin caché y 0,87 dólares por millón de tokens de salida. La propia página de precios indica que, tras finalizar la promoción del 75 % el 31 de mayo de 2026, la tarifa del modelo Pro se ajustará oficialmente a una cuarta parte del precio original.
El movimiento no afecta solo a un modelo ligero pensado para tareas baratas. DeepSeek-V4-Pro es la versión más potente de la familia V4, con soporte para razonamiento, uso de herramientas, salida estructurada y una ventana de contexto de gran tamaño. Eso cambia la lectura competitiva: DeepSeek no está bajando el precio de una opción secundaria, sino de un modelo con aspiración de competir en cargas intensivas como agentes, programación, análisis documental, RAG y automatización empresarial.
La guerra ya no está solo en los benchmarks, sino en el coste por tarea
Durante los últimos dos años, la conversación sobre modelos de IA ha estado dominada por capacidades: razonamiento, código, contexto, multimodalidad, herramientas, benchmarks y calidad de respuesta. Esa carrera sigue abierta, pero DeepSeek está empujando otra métrica al centro: cuánto cuesta ejecutar trabajo real a escala.
La diferencia frente a los modelos occidentales de gama alta es muy grande. OpenAI lista GPT-5.5 a 5 dólares por millón de tokens de entrada, 0,50 dólares por millón de entrada cacheada y 30 dólares por millón de salida. Anthropic sitúa Claude Opus 4.7 en 5 dólares por millón de tokens de entrada y 25 dólares por millón de salida, con descuentos por caché y procesamiento por lotes.
La comparación no debe hacerse como si todos los modelos fueran idénticos. No lo son. Cambian la calidad, la latencia, el ecosistema, la disponibilidad, el cumplimiento normativo, la seguridad, el soporte y la confianza empresarial. Pero para muchos desarrolladores y empresas, la pregunta inicial es más simple: si un flujo consume cientos de millones o miles de millones de tokens al mes, el precio por token puede decidir si el producto es viable o no.
| Modelo | Entrada cacheada por 1M tokens | Entrada sin caché por 1M tokens | Salida por 1M tokens | Lectura rápida |
|---|---|---|---|---|
| DeepSeek V4-Pro | 0,003625 $ | 0,435 $ | 0,87 $ | Rebaja permanente del 75 %, muy agresiva para agentes y contexto largo |
| DeepSeek V4-Flash | 0,0028 $ | 0,14 $ | 0,28 $ | Opción más barata para tareas de volumen y baja latencia |
| OpenAI GPT-5.5 | 0,50 $ | 5,00 $ | 30,00 $ | Modelo frontier caro en salida y tareas largas |
| Anthropic Claude Opus 4.7 | 0,50 $ en cache hits | 5,00 $ | 25,00 $ | Precio alto, con ahorro si se usa caché o batch |
| Google Gemini 3.5 Flash | Según modalidad de caché | 1,50 $ | 9,00 $ | Más barato que modelos frontier, pero más caro que DeepSeek V4-Pro |
Los precios pueden cambiar según la fecha de lectura, región, proveedor, modalidad de ejecución, caché, batch processing, prioridad, acuerdos empresariales o límites de capacidad. En IA, además, el precio por millón de tokens no siempre coincide con el coste por tarea: un modelo puede ser más barato por token pero necesitar más pasos, más contexto o más supervisión humana.
Por qué la rebaja de DeepSeek es un problema para sus rivales
El coste de inferencia se ha convertido en una de las grandes preocupaciones de la IA empresarial. Los agentes no funcionan como un chatbot simple. Leen archivos, generan planes, llaman a herramientas, escriben código, revisan errores, reintentan pasos y mantienen contexto durante muchas interacciones. Eso multiplica el consumo de tokens.
DeepSeek está atacando justo ese punto. Una entrada cacheada casi simbólica favorece aplicaciones donde se reutiliza mucho contexto: bases documentales, asistentes empresariales con instrucciones largas, agentes de desarrollo, sistemas RAG, análisis de contratos o flujos internos con memoria de sesión. Si el mismo contexto puede reaprovecharse muchas veces a un coste muy bajo, el diseño económico de una aplicación cambia.
La presión para OpenAI, Anthropic y Google no llega solo por la tarifa. Llega porque muchos productos de IA se están construyendo sobre márgenes todavía inciertos. Si un competidor baja radicalmente el precio de un modelo avanzado, obliga al resto a justificar por qué cuestan mucho más. En grandes empresas reguladas, la respuesta puede estar en seguridad, cumplimiento, soporte, residencia de datos o integración. En startups, desarrolladores independientes y mercados sensibles al precio, la respuesta puede no ser suficiente.
DeepSeek ya había sacudido el mercado con modelos competitivos y tarifas muy bajas. En abril, The Next Web recogió que la compañía ofrecía un descuento del 75 % para V4-Pro y recortaba también los precios de cache hit en su API. La diferencia ahora es que la rebaja deja de ser un incentivo temporal y pasa a formar parte de la estructura normal de precios.
La variable china: hardware propio y estrategia industrial
La rebaja también tiene una lectura geopolítica. DeepSeek forma parte de un ecosistema chino que intenta reducir su dependencia de NVIDIA y de la infraestructura estadounidense. Algunos análisis han vinculado la familia V4 con el uso de chips Huawei Ascend 950, y Fortune apuntó que DeepSeek esperaba poder reducir precios a medida que Huawei escalara la producción de esos procesadores. DeepSeek no ha confirmado que la rebaja permanente esté directamente vinculada a esa disponibilidad, así que conviene tratar esa relación como una hipótesis razonable, no como un hecho cerrado.
La cuestión de fondo es que China no está compitiendo solo modelo contra modelo. Está intentando construir una pila más autónoma: chips, centros de datos, frameworks, modelos, APIs y precios agresivos para desarrolladores. Si logra que esa cadena funcione con costes mucho menores, la ventaja no será solo técnica. Será económica.
La comparación con otras industrias chinas es inevitable. En memoria, paneles solares, baterías o vehículos eléctricos, China ha demostrado capacidad para usar escala, integración industrial y presión de precios para reordenar mercados globales. En IA, el equivalente no son chips físicos vendidos con descuento, sino tokens baratos que permiten construir productos más intensivos en inferencia.
Esto no significa que DeepSeek vaya a “arruinar” automáticamente a la industria occidental de IA. OpenAI, Anthropic y Google siguen teniendo ventajas importantes: marca, distribución, acuerdos empresariales, ecosistema cloud, confianza en determinados mercados, integración con herramientas de productividad y modelos muy sólidos. Pero la rebaja de DeepSeek cambia el terreno de juego, porque hace más difícil vender la idea de que los modelos avanzados tienen que costar siempre decenas de dólares por millón de tokens de salida.
Una oportunidad para desarrolladores y una amenaza para los márgenes
Para desarrolladores, la rebaja abre posibilidades claras. Permite experimentar con agentes más largos, contextos persistentes, análisis documental intensivo o automatizaciones que antes podían resultar demasiado caras. También puede impulsar productos en mercados donde el coste de la IA era una barrera de entrada.
Para los proveedores rivales, el riesgo es doble. Si no bajan precios, pueden perder cuota en usos sensibles al coste. Si los bajan demasiado, pueden erosionar márgenes en un negocio que exige inversiones enormes en centros de datos, energía, talento y chips. La guerra de precios de la IA no se parece a una bajada puntual de software. Afecta directamente a la economía de la inferencia.
También hay riesgos para los clientes. Elegir un modelo solo por precio puede salir caro si hay problemas de latencia, disponibilidad, privacidad, cumplimiento, soporte, precisión o dependencia de un proveedor. En sectores regulados, el coste por token no puede ser el único criterio. Pero para tareas internas, prototipos, agentes de bajo riesgo y productos de alto volumen, la presión económica será difícil de ignorar.
La IA entra así en una fase más adulta y más dura. Ya no basta con decir que un modelo es más inteligente. Hay que demostrar que resuelve tareas a un coste asumible. DeepSeek ha decidido competir en ese punto con una agresividad que puede obligar al resto del mercado a moverse.
La pregunta ahora no es si habrá una guerra de precios. Ya ha empezado. La pregunta es quién puede sobrevivir a ella sin quemar sus márgenes, su infraestructura o la confianza de sus clientes.
Preguntas frecuentes
¿Qué ha hecho DeepSeek con V4-Pro?
DeepSeek ha convertido en permanente la rebaja del 75 % aplicada a su modelo DeepSeek-V4-Pro, dejando el precio oficial en una cuarta parte del nivel original.
¿Cuánto cuesta ahora DeepSeek V4-Pro?
Según su documentación, cuesta 0,003625 dólares por millón de tokens de entrada con caché, 0,435 dólares por millón de entrada sin caché y 0,87 dólares por millón de salida.
¿Por qué es importante esta bajada de precio?
Porque afecta a un modelo avanzado, no solo a una versión ligera. Esto puede abaratar agentes, programación asistida, RAG, análisis documental y aplicaciones con contexto largo.
¿Significa esto que DeepSeek es mejor que OpenAI o Anthropic?
No necesariamente. DeepSeek es mucho más barato en esta comparativa, pero las empresas deben valorar también calidad, seguridad, soporte, cumplimiento, latencia, disponibilidad y confianza.













