Machine Learning, Noticias
25/04/2025

MAGI-1: la nueva IA china de vídeo que amenaza la hegemonía de Sora y Gemini

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

La supremacía de OpenAI y Google en el terreno de la inteligencia artificial generativa enfrenta un nuevo desafío procedente de China. Sand AI ha presentado MAGI-1, un modelo de vídeo basado en IA que, según sus creadores, supera ampliamente en calidad y control a Sora, Gemini y otras soluciones comerciales.

Con un enfoque revolucionario y un rendimiento sobresaliente en tareas de generación de vídeo, MAGI-1 se perfila como un nuevo referente en el sector, además de apostar por la apertura del código, al liberar su modelo y herramientas en GitHub.

¿Qué es MAGI-1?

MAGI-1 es un modelo de difusión autoregresiva con 24.000 millones de parámetros, diseñado para generar vídeos de duración ilimitada a partir de imágenes o instrucciones textuales. A diferencia de otros modelos de IA que trabajan los vídeos de forma global, MAGI-1 genera los vídeos en fragmentos secuenciales de 24 fotogramas, asegurando una coherencia temporal superior y permitiendo transiciones fluidas y controladas entre escenas.

Cada fragmento es tratado como una unidad de trabajo: primero se elimina el ruido, y una vez estabilizado, se inicia el siguiente, posibilitando un procesamiento concurrente y una síntesis de vídeo en tiempo real ideal para aplicaciones de streaming.

Principales innovaciones de MAGI-1

Modelo de difusión basado en Transformer mejorado con técnicas como Block-Causal Attention, QK-Norm y Sandwich Normalization.
Autoregresión de fragmentos: garantiza la continuidad temporal en vídeos de larga duración.
Control de generación por fragmentos: permite definir eventos o narrativas distintas en diferentes partes del vídeo.
Programación progresiva de ruido durante el entrenamiento, para fortalecer la consistencia causal.
Inferencia optimizada: generación acelerada y eficiente sin sacrificar calidad visual.

¿En qué supera MAGI-1 a sus competidores?

En evaluaciones internas y comparativas, MAGI-1 ha mostrado:

Mejor calidad de movimiento y mayor adherencia a instrucciones que modelos como Wan-2.1 y HunyuanVideo.
Competencia directa con soluciones comerciales cerradas como Kling, Hailuo (i2v-01) y Sora, superándolas en varios parámetros de realismo de movimiento y control narrativo.
Mejor rendimiento físico en tareas de continuación de vídeo, liderando las métricas del benchmark Physics-IQ en modelado de comportamientos físicos realistas.

En pruebas prácticas, MAGI-1 logra generar vídeos con una fluidez y coherencia temporal que, hasta ahora, solo estaba al alcance de los sistemas de IA más avanzados y cerrados.

Código abierto y ambición global

Una de las características más destacadas de MAGI-1 es su apuesta por el código abierto. Sand AI ha publicado en GitHub:

Los pesos preentrenados de los modelos (MAGI-1-24B y una versión más ligera, MAGI-1-4.5B).
El código de inferencia completo.
Documentación técnica detallada y ejemplos de uso.

mag 1 dit architecture

Esta estrategia democratiza el acceso a tecnologías de generación de vídeo avanzadas, permitiendo que desarrolladores, investigadores y empresas puedan experimentar, adaptar o integrar MAGI-1 en sus propios proyectos.

Una amenaza real para la hegemonía occidental en IA

Figuras destacadas del sector, como Kai-Fu Lee, director de Microsoft Research Asia, ya han reconocido el potencial disruptivo de MAGI-1. Al igual que ocurrió con DeepSeek en el ámbito del procesamiento de lenguaje natural, MAGI-1 podría marcar un antes y un después en la generación de vídeo mediante IA.

Frente a modelos cerrados como Sora (OpenAI) o Gemini (Google DeepMind), que mantienen su tecnología como un secreto comercial, MAGI-1 no solo compite en calidad, sino que abre la carrera tecnológica a un mayor número de actores.

Conclusión

El lanzamiento de MAGI-1 confirma que la competencia global en inteligencia artificial se está acelerando y diversificando. La calidad, flexibilidad y accesibilidad de este modelo chino de código abierto suponen una advertencia clara a los gigantes tecnológicos tradicionales: la innovación en IA no tiene fronteras.

MAGI-1 no es solo un modelo más; es el símbolo de una nueva etapa donde la generación de vídeo por IA combina realismo, control narrativo y democratización del acceso.

Referencias: diario amodei, TechCrunch, Hipertextual y código MAG-1 en GitHub.

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Alan Sonny

Escribo sobre inteligencia artificial, robótica y tecnología y sigo la actualidad y notas del sector.

Últimos artículos

Tesla presenta a Optimus: el robot humanoide capaz de navegar terrenos difíciles

China apunta a superar a Tesla con su avance en robots humanoides

Tesla revoluciona la visión de los robots autónomos con un nuevo sistema basado en IA

Accionistas de Tesla demandan a Elon Musk por desviar recursos a su startup xAI

Elon Musk redefine a Tesla: Más que autos, una empresa de IA y robótica

Artículos relacionados

Tu Equipo de Servicio Tiene un Nuevo Compañero: Un Supergenio de 15 Mil Millones de Parámetros de ServiceNow y NVIDIA

Apple desarrolla una nueva versión de Xcode con la IA de Claude, el modelo de Anthropic

Phi-4: los modelos pequeños de Microsoft que desafían a los gigantes de la Inteligencia Artificial

Speakr: la alternativa autoalojada para transcripción, resumen y consulta de audios

Expertos de NVIDIA Comparten 5 Consejos Clave para Destacar en el Mercado Laboral de IA

Elena Digital López

Acelera tus Decisiones Basadas en Datos con AWS Trusted Advisor y Amazon Q Business

Elena Digital López

Crea un Asistente Financiero Potenciado por IA Generativa con la Colaboración de Múltiples Agentes de Amazon Bedrock

Elena Digital López

WordFinder: Potenciando La Comunicación en Personas Con Afasia a Través de IA Generativa en AWS