La empresa rusa Yandex presentó su Red de Renderizado de Inteligencia Artificial (YandexART), una red neuronal diseñada para generar imágenes y animaciones a partir de indicaciones en texto. En la actualidad, esta tecnología está integrada en la aplicación Shedevrum, asiste en la visualización de anuncios en Yandex Business y pronto estará disponible en el teclado de Yandex y otros servicios de la compañía.
El proceso de YandexART se basa en una difusión en cascada. Primero, la red neuronal crea imágenes y fotogramas a partir de las indicaciones textuales del usuario, luego va mejorando progresivamente la resolución de la imagen y añadiendo detalles. Frente a la generación anterior del modelo de difusión de Shedevrum, los gráficos de YandexART son notablemente más realistas y detallados. De acuerdo con evaluaciones internas, el modelo ofrece mejores resultados en el 60% de los casos.
Para optimizar la calidad, Yandex amplió el conjunto de datos de entrenamiento en un factor de 1.5, alcanzando un total de 330 millones de imágenes con descripciones textuales. YandexART cuenta con tres modos de filtrado para mostrar las imágenes más estéticamente agradables. Además, un nuevo algoritmo de reconocimiento de texto ayuda a la red neuronal a comprender mejor las peticiones de los usuarios.
La red actualizada tiene una capacidad superior para renderizar rostros, ojos y manos, lo que le permite elaborar retratos hiperrealistas. Además, posee un mejor entendimiento de diversas culturas. YandexART reconoce lugares y ciudades famosas, figuras históricas relevantes y personajes de dibujos animados y cuentos populares a nivel mundial.
Para seguir mejorando los resultados de generación, Yandex emplea aprendizaje por refuerzo con retroalimentación humana. Por ejemplo, el equipo puede revisar cientos o miles de imágenes de capibaras generadas por YandexART y etiquetar cuáles son adecuadas o no. Este proceso ayuda a la red neuronal a representar con mayor precisión animales, personajes, objetos y características.
Aplicaciones de YandexART
● Shedevrum: En esta aplicación, YandexART asiste a los usuarios en la generación de imágenes y videos. Desde su lanzamiento, ha sido utilizada más de 100 millones de veces.
● Yandex Business: Al crear anuncios, los usuarios pueden seleccionar imágenes generadas previamente por YandexART. El banco de imágenes generadas por IA de Yandex Business contiene cerca de 3.000 imágenes que abarcan 650 campos empresariales diferentes.
● Teclado Yandex: Próximamente, los usuarios podrán generar una imagen basada en una descripción textual y establecerla como fondo dxe teclado. Esta función estará disponible a finales de 2023.
Más sobre Yandex
Shedevrum es una aplicación móvil de Yandex donde los usuarios pueden generar videos, imágenes y textos con ayuda de la IA. Desde su lanzamiento en abril de 2023, se ha posicionado en lo más alto de las tiendas App Store y Google Play en Rusia.
Yandex Business es un servicio destinado a publicidad online en la búsqueda de Yandex, Yandex Maps y en más de 55.000 sitios y aplicaciones asociados. Está dirigido principalmente a pequeñas y medianas empresas.
Teclado Yandex es un teclado virtual para dispositivos móviles. Facilita la escritura, ofrece sugerencias impulsadas por IA y cuenta con un traductor con soporte para más de 100 idiomas.
vía: Yandex