La herramienta V1 permite transformar imágenes en clips animados y marca el primer paso hacia entornos 3D interactivos generados por IA
Midjourney ha anunciado oficialmente el lanzamiento de su modelo de vídeo V1, un hito en su evolución tecnológica que deja atrás la generación de imágenes estáticas para entrar de lleno en la animación. La nueva herramienta permite convertir imágenes en clips animados de cinco segundos —ampliables hasta 20— con solo pulsar un botón. Esta función, disponible inicialmente en la versión web, representa un paso decisivo en la estrategia de la empresa: construir un sistema unificado de simulación del mundo real impulsado por inteligencia artificial.
Un modelo sencillo pero potente: imagen a vídeo
V1 introduce un nuevo flujo de trabajo denominado Image-to-Video, donde los usuarios de Midjourney pueden seguir generando imágenes como hasta ahora, pero con la posibilidad de animarlas directamente mediante la función Animate. El sistema genera cuatro versiones de vídeo por imagen, cada una con una duración de cinco segundos. Además, es posible extender cada clip en bloques de cuatro segundos, hasta un máximo total de 20 segundos por animación.
El modelo ofrece dos modalidades de animación:
- Automática: la IA decide cómo dar movimiento a la escena, aplicando un motion prompt predefinido.
- Manual: el usuario introduce instrucciones específicas sobre cómo desea que se desarrollen los movimientos.
También se pueden elegir dos niveles de intensidad de movimiento:
- Movimiento bajo, ideal para escenas con cámara fija y movimientos suaves del sujeto.
- Movimiento alto, para escenas dinámicas con movimientos simultáneos de cámara y elementos de la imagen, aunque con un mayor riesgo de errores visuales.
La herramienta no se limita a imágenes generadas en Midjourney: los usuarios pueden arrastrar imágenes externas al cuadro de texto y marcarlas como start frame, añadiendo posteriormente un motion prompt personalizado para definir la animación deseada.
De imágenes a simulaciones interactivas
Midjourney ha comunicado que este modelo de vídeo es solo una pieza dentro de un proyecto más ambicioso: crear entornos abiertos e interactivos en tiempo real generados por IA. El objetivo a medio plazo es combinar modelos de imagen, vídeo, 3D y procesamiento en tiempo real en una única plataforma.
“Imaginad un sistema de inteligencia artificial que genera imágenes en tiempo real, con entornos y personajes en movimiento, donde puedas moverte por el espacio 3D e interactuar con todo”, explica la compañía en su anuncio oficial. Este sistema, aún en fase de desarrollo, pretende sentar las bases de una nueva forma de explorar mundos digitales con una naturalidad sin precedentes.
Coste y disponibilidad
En su lanzamiento, el modelo V1 está disponible exclusivamente a través de la web. Generar un vídeo cuesta aproximadamente ocho veces más que una imagen, lo que equivale a un segundo de vídeo por cada imagen en términos de coste. Esta relación sorprende por su eficiencia: Midjourney asegura que el precio es más de 25 veces inferior al de otras soluciones similares del mercado.
Para usuarios frecuentes, la empresa recomienda actualizar el nivel de suscripción para acceder a tiempos de generación más rápidos y mayor disponibilidad de recursos. También se está probando un modo relax para vídeos, dirigido a suscriptores del plan Pro o superior.
Llamado al uso responsable
Midjourney ha enfatizado la importancia de un uso ético de la herramienta: “Pedimos que utilicéis esta tecnología de manera responsable. Bien utilizada, no solo es divertida, también puede ser realmente útil o incluso profunda”, afirman.
La advertencia cobra especial relevancia dado el contexto actual: Disney y Universal han demandado a Midjourney por el supuesto uso de contenido con derechos de autor para entrenar sus modelos de IA. El litigio, aún en curso, incluye como evidencia imágenes generadas con la herramienta que reproducen con gran fidelidad a personajes como Homer Simpson y Darth Vader.
Un nuevo capítulo para la creatividad generativa
Pese a que V1 es aún una versión preliminar con limitaciones, su lanzamiento supone una ruptura clara con el paradigma de imágenes estáticas y una invitación a explorar nuevas formas narrativas, visuales e interactivas. Con cada actualización, Midjourney va acercándose más a su visión de construir mundos vivos, personalizables y generados en tiempo real por IA, accesibles para creadores, desarrolladores y usuarios por igual.
En una industria que avanza a toda velocidad, el modelo V1 de Midjourney no pretende ser el más potente, sino el más versátil. Un primer paso tangible hacia un futuro donde lo visual, lo narrativo y lo interactivo converjan en una experiencia completamente generativa.