Optimización De Metadatos De Video: Cómo DPG Media Utiliza Amazon Bedrock Y Amazon Transcribe Con Inteligencia Artificial

Elena Digital López

DPG Media, un importante consorcio mediático en la región del Benelux, ha adoptado un audaz enfoque hacia la modernización de sus métodos de gestión de datos a través del uso de inteligencia artificial. Enfrentándose al reto de manejar un vasto y en constante crecimiento catálogo de contenido audiovisual mediante su plataforma VTM GO, que ofrece más de 500 días de contenido continuo, la compañía ha decidido integrar tecnologías de Amazon, como Bedrock y Transcribe, en sus procesos de publicación de video. Esta evolución tiene como objetivo optimizar la generación y administración de metadatos asociados a sus contenidos.

La expansión de su biblioteca de videos llevó a DPG Media a identificar la necesidad crítica de una gestión eficiente de los metadatos, los cuales incluyen información sobre actores, géneros, resúmenes de episodios y el tono emocional de los programas. La precisión en estos datos no solo enriquece las descripciones en las guías de televisión, sino que también mejora las recomendaciones de contenido y la navegación para los consumidores.

Al embarcarse en este proceso de automatización, DPG Media enfrentó varios desafíos, incluyendo la diversidad de idiomas, la variabilidad en el volumen de contenido y la frecuencia de lanzamientos, factores que complican la estandarización de metadatos. Además, la agregación de datos requería una consolidación confiable a lo largo de diferentes temporadas de un programa.

Para abordar estos obstáculos, DPG Media centró su estrategia en el procesamiento de audio, dejando de lado el análisis de datos de video debido a su alto costo y tiempo de procesamiento. Se implementó un sistema de dos pasos: primero, la generación de transcripciones de pistas de audio mediante modelos de reconocimiento de voz; y segundo, la extracción y generación de metadatos detallados utilizando modelos de lenguaje extensivo (LLMs).

En la fase inicial del proyecto, DPG Media evaluó diversas estrategias de transcripción, optando finalmente por Amazon Transcribe, una solución administrada que ofrece transcripciones de audio precisas, con actualizaciones automáticas de modelos y funciones de diarización de locutores. Para la generación de metadatos, se recurrió a Amazon Bedrock, empleando el modelo Anthropic Claude 3 Sonnet, escogido por su desempeño en lengua holandesa y su capacidad de razonamiento.

La implementación de esta solución ha permitido a DPG Media ahorrar tiempo significativo en la generación de metadatos, optimizando el trabajo desde la producción de subtítulos hasta la creación de resúmenes detallados de series completas. Aunque el sistema genera automáticamente los metadatos, se ha mantenido una validación humana para garantizar la calidad del resultado final antes de presentarlo a los clientes. Este enfoque no solo mejora la experiencia del usuario al ofrecer recomendaciones más precisas, sino que también refuerza el compromiso de DPG Media de combinar las capacidades humanas con tecnologías avanzadas.

Esta iniciativa refleja un avance hacia una modernización continua y una mejora de la experiencia del consumidor en una industria que se encuentra en constante evolución. DPG Media sigue explorando nuevas oportunidades para experimentar con modelos adicionales y mejorar sus sistemas conforme avanza la tecnología, siempre buscando alinear su oferta de contenido con los hábitos de consumo modernos y las innovaciones tecnológicas.

Scroll al inicio