Google ha dado un paso adelante en la evolución de sus tecnologías de medios generativos con el lanzamiento de Veo, su modelo de generación de videos más avanzado, e Imagen 3, su modelo de texto a imagen de mayor calidad. Estas innovaciones están diseñadas para potenciar la creatividad de los usuarios y facilitar la creación de contenido de alta calidad.
Veo: El Modelo de Generación de Videos Más Capaz
Veo es el modelo de generación de videos más avanzado de Google, capaz de crear videos de alta calidad en resolución 1080p con estilos cinematográficos. Este modelo no solo entiende el lenguaje natural y los términos visuales, sino que también puede capturar con precisión el tono y los detalles de los prompts más largos.
Características Principales de Veo:
- Genera videos coherentes y consistentes donde personas, animales y objetos se mueven de manera realista.
- Entiende términos cinematográficos como «timelapse» o «tomas aéreas de un paisaje».
- Ofrece un control creativo sin precedentes, permitiendo a los usuarios capturar su visión de manera precisa.
Veo se ha desarrollado a partir de años de investigación en modelos generativos de video, incluyendo tecnologías como Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet y Lumiere. Este modelo estará disponible para selectos creadores en vista previa privada a través de VideoFX.
Imagen 3: El Modelo de Texto a Imagen de Mayor Calidad
Imagen 3 es el modelo de generación de imágenes más avanzado de Google, capaz de producir imágenes fotorrealistas con un nivel de detalle impresionante y menos artefactos visuales. Este modelo entiende mejor el lenguaje natural y puede captar detalles pequeños en prompts largos, lo que lo convierte en una herramienta ideal para crear imágenes personalizadas de alta calidad.
Características Principales de Imagen 3:
- Genera imágenes fotorrealistas con un nivel de detalle sin precedentes.
- Mejora la capacidad de renderizado de texto, ideal para crear mensajes de cumpleaños personalizados, diapositivas de títulos y más.
- Disponible para selectos creadores en vista previa privada en ImageFX.
Colaboraciones con la Comunidad Musical
Google también está explorando el papel de la IA en la creación de arte y música a través de colaboraciones con artistas destacados. En asociación con YouTube, Google ha trabajado con músicos como Wyclef Jean, el compositor nominado al Grammy Justin Tranter y el músico electrónico Marc Rebillet. Estas colaboraciones están informando el desarrollo de las tecnologías de música generativa de Google, incluyendo Lyria, su modelo más avanzado para la generación de música por IA.
Como parte de este esfuerzo, Google ha desarrollado Music AI Sandbox, una suite de herramientas de IA para la música que permite a los usuarios crear nuevas secciones instrumentales desde cero y transformar sonidos de maneras innovadoras. Las primeras demos creadas con estas herramientas están disponibles en los canales de YouTube de los artistas colaboradores.
Desarrollo Responsable
Google está comprometido con el desarrollo responsable de sus tecnologías generativas. Para abordar los desafíos asociados con estas tecnologías, la compañía ha implementado pruebas de seguridad, filtros y barreras de protección, además de incorporar marcas de agua digitales en el contenido generado por IA utilizando herramientas como SynthID. A partir de hoy, todos los videos generados por Veo en VideoFX estarán marcados con SynthID para garantizar la autenticidad y seguridad del contenido.
Conclusión
El potencial creativo de la IA generativa es inmenso, y Google está liderando el camino con Veo e Imagen 3. Estas herramientas no solo facilitan la creación de contenido de alta calidad, sino que también abren nuevas posibilidades para la creatividad y la innovación. Con estas innovaciones, Google continúa reimaginando lo que es posible en el campo de la inteligencia artificial y la generación de medios.
vía: blog Google