MiniMax M3 desafía a los modelos cerrados con código, 1M de contexto y bajo coste

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

MiniMax ha presentado M3, un nuevo modelo de inteligencia artificial que llega con una promesa ambiciosa: combinar capacidades de programación y agentes cercanas a los modelos frontera, una ventana de contexto de hasta 1 millón de tokens y entrada multimodal nativa desde su diseño inicial. La compañía lo describe como el primer modelo de pesos abiertos que reúne esas tres características en un solo sistema, aunque el sector tendrá que esperar a disponer del informe técnico completo y de los pesos para evaluar con más calma sus límites reales.

El anuncio llega en un momento de fuerte competencia entre laboratorios estadounidenses y chinos por dominar el mercado de modelos capaces de programar, usar herramientas, navegar por entornos complejos y trabajar con grandes volúmenes de contexto. Hasta hace poco, estas capacidades quedaban asociadas a modelos cerrados de gama alta como Claude Opus, GPT, Gemini o los sistemas propietarios de agentes. MiniMax intenta romper esa frontera con un modelo que, al menos según sus propios datos, compite en varios benchmarks de código y tareas agentic a un coste muy inferior.

La propuesta no se limita a una tabla de resultados. MiniMax ha acompañado M3 con MiniMax Code, una plataforma para agentes de programación, y con planes de suscripción orientados a desarrolladores. También ofrece acceso API con precios agresivos: 0,60 dólares por millón de tokens de entrada, 2,40 dólares por millón de tokens de salida y 0,12 dólares por millón de tokens en lectura de caché para contextos de hasta 512K. Durante los primeros siete días, la compañía aplica un descuento del 50 % en el uso estándar, según la información comercial difundida por sus socios de acceso.

Un modelo pensado para agentes de programación

El foco principal de MiniMax M3 está en la programación y en el trabajo agentic, es decir, en tareas donde el modelo no solo responde una pregunta, sino que planifica, ejecuta pasos, usa herramientas, revisa resultados y mantiene una interacción prolongada con el usuario o con un entorno de desarrollo.

Según MiniMax, M3 alcanza un 59,0 % en SWE-Bench Pro, un 66,0 % en Terminal-Bench 2.1, un 34,8 % en SWE-fficiency, un 28,8 % en KernelBench Hard y un 74,2 % en MCP Atlas. La compañía afirma que en SWE-Bench Pro supera a GPT-5.5 y Gemini 3.1 Pro, y que se aproxima a Claude Opus 4.7. También asegura que supera a Opus 4.7 en SVG-Bench y BrowseComp.

Estos datos son relevantes porque miden tareas cada vez más cercanas al uso real de los modelos por parte de desarrolladores: edición de repositorios, ejecución en terminal, navegación, generación visual estructurada, uso de herramientas y trabajo sobre contextos largos. Aun así, conviene mantener prudencia. Los benchmarks son útiles, pero no sustituyen pruebas independientes sobre proyectos reales, repositorios privados, deuda técnica, seguridad del código, latencia, coste total y estabilidad en sesiones largas.

MiniMax sostiene que ha entrenado M3 con un simulador interactivo de usuarios para acercar el entrenamiento a la forma en que trabajan los desarrolladores. En vez de centrarse solo en tareas de una única instrucción, el modelo habría sido expuesto a escenarios de colaboración más largos, con aclaraciones, correcciones, cambios de contexto y revisión de soluciones. Esa aproximación tiene sentido: los agentes de código no fallan solo por no saber escribir una función, sino por perder el hilo de un proyecto, romper dependencias o no entender la intención del usuario tras varias rondas.

La clave técnica: contexto largo con atención escasa

Una de las piezas más importantes de M3 es MiniMax Sparse Attention, o MSA. La atención completa tradicional se encarece mucho cuando crece la ventana de contexto, porque el coste computacional aumenta de forma muy rápida. MSA intenta reducir ese problema seleccionando bloques relevantes del caché KV y evitando procesar todo el contexto con la misma intensidad.

MiniMax afirma que, a 1 millón de tokens, M3 reduce el cómputo por token a una vigésima parte respecto a su generación anterior. También habla de una mejora superior a 9 veces en prefill y de más de 15 veces en decodificación en contexto completo. Si estos datos se confirman en despliegues reales, el avance tendría interés para tareas donde los modelos necesitan leer bases de código completas, documentos extensos, logs, conversaciones largas o materiales técnicos con imágenes y texto intercalados.

La ventana de 1 millón de tokens no es solo una cifra comercial. En el desarrollo de software puede permitir que un agente mantenga más contexto de repositorios grandes, documentación, trazas de ejecución y decisiones previas. En entornos empresariales, abre la puerta a trabajar sobre contratos, expedientes, manuales, datasets documentales o historiales de incidencias sin trocear tanto la información.

El reto, como siempre, será distinguir entre capacidad de contexto y uso efectivo del contexto. Un modelo puede aceptar 1 millón de tokens y aun así ignorar información relevante, confundirse con señales contradictorias o degradar la calidad en los extremos de la ventana. Por eso las pruebas independientes serán decisivas.

Multimodalidad desde el inicio y precios muy agresivos

MiniMax insiste en que M3 es multimodal de forma nativa desde el inicio del entrenamiento. Esto significa que no se habría añadido visión como una capa posterior, sino que texto, imagen y vídeo formarían parte del proceso desde fases tempranas. Según la compañía, el modelo admite entrada de imagen y vídeo, además de texto, y puede operar un ordenador en escenarios de agente.

Este punto lo coloca en la misma dirección que los grandes modelos cerrados, donde la frontera ya no está solo en responder texto, sino en entender interfaces, gráficos, capturas de pantalla, diagramas, vídeos cortos y documentos con estructura visual. Para agentes de programación, la multimodalidad puede ser útil al interpretar errores visuales, interfaces, esquemas de arquitectura o documentación técnica.

El otro elemento llamativo es el precio. MiniMax M3 se ofrece en API con una tarifa estándar de 0,60 dólares por millón de tokens de entrada y 2,40 dólares por millón de tokens de salida para contextos de hasta 512K, con 0,12 dólares por millón de tokens de lectura en caché. Para contextos entre 512K y 1M, la tarifa sube a 1,20 dólares de entrada, 4,80 dólares de salida y 0,24 dólares de caché. Además, sus planes mensuales anuncian volúmenes de uso muy altos: Plus por 20 dólares al mes con unos 1.700 millones de tokens, Max por 50 dólares con unos 5.100 millones y Ultra por 120 dólares con hasta 12.500 millones, según la página promocional compartida.

Plan o modalidad	Precio anunciado	Uso incluido o coste
API M3 hasta 512K	0,60 $ entrada / 2,40 $ salida	por millón de tokens
Caché hasta 512K	0,12 $	por millón de tokens
API M3 entre 512K y 1M	1,20 $ entrada / 4,80 $ salida	por millón de tokens
Plus	20 $/mes	unos 1.700 millones de tokens
Max	50 $/mes	unos 5.100 millones de tokens
Ultra	120 $/mes	hasta 12.500 millones de tokens

Estos precios pueden presionar al mercado si el rendimiento se mantiene. La combinación de modelo potente, contexto largo y coste bajo es especialmente atractiva para agentes de código, donde una sesión puede consumir cientos de miles de tokens entre lectura de archivos, planificación, generación, pruebas y correcciones. En ese terreno, el coste por token no es un detalle: decide si un agente se usa para una consulta puntual o para trabajar durante horas sobre un proyecto.

La lectura estratégica: China compite también en modelos abiertos

MiniMax M3 confirma una tendencia más amplia: los laboratorios chinos están usando los modelos de pesos abiertos como herramienta competitiva frente a la ventaja comercial de los grandes proveedores estadounidenses. DeepSeek, Qwen, Kimi, Zhipu, MiniMax y otros actores han demostrado que la presión no llega solo desde modelos cerrados, sino también desde alternativas accesibles, más baratas y con capacidad de integración en herramientas de terceros.

Para desarrolladores y empresas europeas, esto abre una oportunidad y una cautela. La oportunidad está en disponer de modelos potentes, con menor coste y más opciones de despliegue o integración. La cautela está en la licencia, el origen del modelo, la gobernanza, la seguridad, la privacidad, la dependencia de proveedores externos y la validación independiente de resultados. “Pesos abiertos” no siempre significa “open source” en sentido estricto, ni implica libertad comercial plena o ausencia de restricciones.

MiniMax tiene ahora que demostrar tres cosas: que los benchmarks se sostienen fuera de sus propios entornos, que la experiencia real de MiniMax Code compite con herramientas consolidadas y que la apertura de pesos e informe técnico permite a la comunidad auditar arquitectura, límites, licencia y reproducibilidad. El modelo llega con una hoja de presentación fuerte, pero el mercado de IA ya ha aprendido que las demos espectaculares necesitan pruebas largas.

La dirección, en cualquier caso, es clara. La próxima batalla no será solo por el modelo que mejor responda en una conversación aislada, sino por el sistema que mejor trabaje durante horas: leyendo contexto enorme, usando herramientas, programando, viendo interfaces, corrigiendo errores y manteniendo costes razonables. MiniMax M3 entra en esa pelea con una propuesta agresiva. Ahora toca comprobar si el rendimiento real está a la altura del ruido inicial.

Preguntas frecuentes

¿Qué es MiniMax M3?
MiniMax M3 es un modelo de inteligencia artificial presentado por MiniMax con foco en programación, agentes, contexto largo de hasta 1 millón de tokens y entrada multimodal de texto, imagen y vídeo.

¿Es un modelo open source?
MiniMax lo presenta como un modelo de pesos abiertos, pero conviene esperar a revisar licencia, pesos publicados e informe técnico completo. Pesos abiertos y open source no significan siempre lo mismo.

¿Por qué importa su ventana de 1M tokens?
Porque permite trabajar con bases de código grandes, documentos extensos, logs, conversaciones largas o materiales técnicos complejos sin partir tanto el contexto. La utilidad real dependerá de cómo use el modelo esa información.

¿Cuánto cuesta usar MiniMax M3?
La tarifa API anunciada para contextos de hasta 512K es de 0,60 dólares por millón de tokens de entrada, 2,40 dólares por millón de salida y 0,12 dólares por millón en lectura de caché, con promoción inicial del 50 % durante siete días.