Una Nueva Era en la Generación de Videos

Elena Digital López

Una semana después de que OpenAI presentara su modelo de generación de video, Sora, Google DeepMind ha dado un paso adelante en la revolución del contenido audiovisual con el lanzamiento de Veo 2. Este innovador modelo promete transformar la creación de videos mediante inteligencia artificial, ofreciendo una calidad de producción sin precedentes al generar videos de alta calidad con resoluciones de hasta 1080p y superando un minuto de duración, lo que permite experimentar una amplia gama de estilos visuales y cinematográficos.

Veo 2 se distingue por su capacidad para producir videos realistas en resoluciones excepcionales, con un profundo entendimiento de diversos tipos de tomas de cámara, como las vistas desde dron, tomas panorámicas y primeros planos. Su habilidad para replicar con precisión la física del mundo real y las expresiones humanas se evidencia en ejemplos como la impresionante captura de un plano en ángulo bajo de flamencos en un lago. Este clip ilustra la belleza natural y la serenidad del entorno, demostrando así el potencial de la tecnología detrás de Veo 2.

Al comparar este modelo con Sora de OpenAI, se encuentran diferencias significativas en sus enfoques. Mientras que Sora sobresale en narrativa creativa y escenarios llenos de imaginación, Veo 2 se centra en el realismo y la precisión física, proporcionando un mayor control en el proceso de generación de video. Pruebas realizadas por Google han situado a Veo 2 por delante de competidores como Sora Turbo, especialmente en la creación de clips de video, aunque se reconocen limitaciones en la generación de escenas complejas y secuencias de movimiento.

Como parte del lanzamiento, Google ha anunciado que la implementación de Veo 2 estará inicialmente limitada a ciertos productos, incluidos VideoFX, YouTube y Vertex AI, con vistas a expandirse a plataformas como YouTube Shorts en 2025. Todos los videos generados utilizarán una marca de agua invisible conocida como SynthID para asegurar transparencia y uso adecuado.

Simultáneamente, DeepMind ha mejorado su modelo de generación de imágenes, Imagen 3, dotándolo de la capacidad de producir imágenes de colores más vivos, mejor composición y detalle. Este nuevo avance está siendo desplegado a nivel global, complementando el lanzamiento de Veo 2. Además, Google Labs ha introducido «Whisk», un experimento que explota las capacidades de Imagen 3 y Gemini permitiendo la interacción a través de imágenes, marcando otro avance significativo en la generación de contenido visual mediante inteligencia artificial.

Scroll al inicio