La era de los agentes de IA para análisis de video ha llegado. En un mundo donde el video representa más del 50% del tráfico de datos global, su potencial de análisis aún está en gran parte sin explotar, con menos del 1% analizado para obtener insights. Sin embargo, esto está a punto de cambiar gracias a una nueva ola de agentes de análisis de video basados en inteligencia artificial.
Con la mitad del PIB mundial derivado de industrias físicas como la energía, automotriz y electrónica, y ante preocupaciones por la escasez laboral, el regreso de la manufactura y la creciente demanda de automatización, los agentes de análisis de video jugarán un papel crítico en la conexión de los mundos físico y digital. Para facilitar el desarrollo de estos agentes, NVIDIA ha lanzado el AI Blueprint para búsqueda y resumen de video, apoyado por la plataforma NVIDIA Metropolis. Esto entrega a los desarrolladores las herramientas necesarias para crear agentes de IA altamente capaces, preparados para analizar grandes volúmenes de video en tiempo real y archivado.
Estos agentes, combinados con modelos de visión por computadora y modelos de lenguaje altamente inteligentes, brindan a las empresas una poderosa herramienta para examinar, buscar y resumir extensas cantidades de video. Esto está desbloqueando nuevas oportunidades en industrias clave como la manufactura y las ciudades inteligentes. Por ejemplo, en el sector manufacturero, los agentes de IA aumentan la seguridad y productividad al optimizar la distribución de equipos y trabajadores. En las ciudades, están ayudando a reducir la congestión y aumentar la seguridad.
El AI Blueprint de NVIDIA para Video Search and Summarization (VSS) se basa en la arquitectura de la plataforma NVIDIA Metropolis y está optimizado con modelos de lenguaje de visión y modelos de lenguaje de gran escala. Incluye capacidades avanzadas como la transcripción de audio a texto, brindando un contexto más profundo a escenarios críticos. Con este blueprint, el tiempo necesario para resumir videos se reduce drásticamente, permitiendo transformar una hora de video en texto en menos de un minuto.
Varias empresas líderes están utilizando este blueprint para desarrollar agentes que mejoran sus operaciones. Pegatron, por ejemplo, adopta el VSS blueprint para optimizar procesos operativos y entrenar a sus empleados. En Kaohsiung, Taiwán, un sistema de inteligencia artificial desarrollada por Linker Vision está mejorando la respuesta a incidentes al integrar análisis de video en tiempo real, reduciendo los tiempos de respuesta hasta en un 80%.
En el ámbito deportivo, la Liga Nacional de Hockey emplea el VAST InsightEngine con el VSS blueprint para acelerar flujos de trabajo mediante la gestión eficiente de grandes volúmenes de metraje de partidos. Este sistema permite la búsqueda instantánea de momentos destacados y facilita la creación de contenido de manera automática.
Otros ejemplos de implementación incluyen el uso de un copiloto industrial por Siemens, que asiste a los trabajadores en la fábrica con tareas de mantenimiento y optimización del rendimiento, y soluciones de publicidad avanzada por PYLER, que han aumentado la efectividad de las campañas al cuadruplicar las tasas de clics de los anuncios.
La disponibilidad de este blueprint está permitiendo a los socios de NVIDIA reducir notablemente el tiempo de desarrollo de sofisticadas capacidades de análisis de video de meses a semanas, facilitando la innovación en diversos sectores.
Fuente: Zona de blogs y prensa de Nvidia