La firma china de inteligencia artificial ShengShu acaba de lanzar Vidu, un modelo de IA para generar vídeos a partir de texto que, según reportes, podría competir con Sora de OpenAI, aún no lanzado al público. Vidu es capaz de crear vídeos de alta calidad de 16 segundos en resolución 1080p basados en indicaciones textuales.
El desarrollo de Vidu comenzó en 2022 utilizando una arquitectura propia que precede al flujo de trabajo DiT de Sora. Durante una demostración en vivo en Beijing, Vidu demostró su capacidad para simular detalles del mundo real como la iluminación adecuada, sombras y expresiones faciales, entre otros.
Aunque pueda parecer exagerado considerarlo un verdadero ‘rival’ de Sora, dado que Sora genera vídeos de hasta 60 segundos contra los 16 segundos de Vidu, el avance de los modelos de IA chinos sigue cerrando la brecha con los líderes estadounidenses. Con Sora aún no disponible para el público, su potencial sigue sin realizarse completamente, dejando espacio para la competencia.
Vidu, que fue creado por Shenshu, una startup fundada hace un año por un ex gerente de proyecto de Tencent, aún no alcanza el nivel de Sora, pero su capacidad para generar clips completos de 16 segundos muestra cuán cerca están los desarrollos chinos en esta área tecnológica. Este avance pone de manifiesto el rápido desarrollo de la inteligencia artificial en China y cómo podría influir en el mercado global de tecnologías de generación de contenido multimedia.