Noticias
15/05/2024

Google lanza veo e imagen 3: Modelos de medios generativos de próxima generación

Por Alan Sonny

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Google ha dado un paso adelante en la evolución de sus tecnologías de medios generativos con el lanzamiento de Veo, su modelo de generación de videos más avanzado, e Imagen 3, su modelo de texto a imagen de mayor calidad. Estas innovaciones están diseñadas para potenciar la creatividad de los usuarios y facilitar la creación de contenido de alta calidad.

Veo: El Modelo de Generación de Videos Más Capaz

Veo es el modelo de generación de videos más avanzado de Google, capaz de crear videos de alta calidad en resolución 1080p con estilos cinematográficos. Este modelo no solo entiende el lenguaje natural y los términos visuales, sino que también puede capturar con precisión el tono y los detalles de los prompts más largos.

Características Principales de Veo:

Genera videos coherentes y consistentes donde personas, animales y objetos se mueven de manera realista.
Entiende términos cinematográficos como «timelapse» o «tomas aéreas de un paisaje».
Ofrece un control creativo sin precedentes, permitiendo a los usuarios capturar su visión de manera precisa.

Veo se ha desarrollado a partir de años de investigación en modelos generativos de video, incluyendo tecnologías como Generative Query Network (GQN), DVD-GAN, Imagen-Video, Phenaki, WALT, VideoPoet y Lumiere. Este modelo estará disponible para selectos creadores en vista previa privada a través de VideoFX.

Imagen 3: El Modelo de Texto a Imagen de Mayor Calidad

Imagen 3 es el modelo de generación de imágenes más avanzado de Google, capaz de producir imágenes fotorrealistas con un nivel de detalle impresionante y menos artefactos visuales. Este modelo entiende mejor el lenguaje natural y puede captar detalles pequeños en prompts largos, lo que lo convierte en una herramienta ideal para crear imágenes personalizadas de alta calidad.

Características Principales de Imagen 3:

Genera imágenes fotorrealistas con un nivel de detalle sin precedentes.
Mejora la capacidad de renderizado de texto, ideal para crear mensajes de cumpleaños personalizados, diapositivas de títulos y más.
Disponible para selectos creadores en vista previa privada en ImageFX.

Colaboraciones con la Comunidad Musical

Google también está explorando el papel de la IA en la creación de arte y música a través de colaboraciones con artistas destacados. En asociación con YouTube, Google ha trabajado con músicos como Wyclef Jean, el compositor nominado al Grammy Justin Tranter y el músico electrónico Marc Rebillet. Estas colaboraciones están informando el desarrollo de las tecnologías de música generativa de Google, incluyendo Lyria, su modelo más avanzado para la generación de música por IA.

Como parte de este esfuerzo, Google ha desarrollado Music AI Sandbox, una suite de herramientas de IA para la música que permite a los usuarios crear nuevas secciones instrumentales desde cero y transformar sonidos de maneras innovadoras. Las primeras demos creadas con estas herramientas están disponibles en los canales de YouTube de los artistas colaboradores.

Desarrollo Responsable

Google está comprometido con el desarrollo responsable de sus tecnologías generativas. Para abordar los desafíos asociados con estas tecnologías, la compañía ha implementado pruebas de seguridad, filtros y barreras de protección, además de incorporar marcas de agua digitales en el contenido generado por IA utilizando herramientas como SynthID. A partir de hoy, todos los videos generados por Veo en VideoFX estarán marcados con SynthID para garantizar la autenticidad y seguridad del contenido.

Conclusión

El potencial creativo de la IA generativa es inmenso, y Google está liderando el camino con Veo e Imagen 3. Estas herramientas no solo facilitan la creación de contenido de alta calidad, sino que también abren nuevas posibilidades para la creatividad y la innovación. Con estas innovaciones, Google continúa reimaginando lo que es posible en el campo de la inteligencia artificial y la generación de medios.

vía: blog Google

X (Twitter) Facebook Pinterest LinkedIn Email WhatsApp

Alan Sonny

Escribo sobre inteligencia artificial, robótica y tecnología y sigo la actualidad y notas del sector.

Últimos artículos

Karpathy pone palabras al “cambio de fase” del coding con LLM… y el creador de Claude Code lo lleva al extremo

Grok, la IA de xAI, solo estará disponible en Teslas con procesadores AMD Ryzen

Tesla presenta a Optimus: el robot humanoide capaz de navegar terrenos difíciles

Tesla presenta el Robotaxi: el futuro del transporte autónomo a precio accesible

China apunta a superar a Tesla con su avance en robots humanoides

Artículos relacionados

Por qué Claude se llama Claude: Shannon, lenguaje y la vieja historia de la IA

Por qué estudiar FP oficial con inteligencia artificial integrada

El caso Mythos: la IA de Anthropic que disparó las alarmas en la NSA

Meta Se Asocia Con Reliance Para Centro de Datos en India Impulsado por Inteligencia Artificial

La soberanía de la IA entra en la cuenta de resultados de las empresas

El prompt que intenta convertir a Claude en asesor crítico, no en asistente complaciente

Adobe lleva su agente creativo a Photoshop, Premiere, Illustrator e InDesign

Cómo Las Acciones De Interconexión De FERC Para Grandes Cargas Ayudan A Aliviar El Estrés De La Red Y Mejorar La Asequibilidad