Las empresas del sector financiero, al igual que otras industrias altamente reguladas, enfrentan desafíos significativos en la gestión de seguridad y el cumplimiento normativo. Para proteger la infraestructura tecnológica crítica, las organizaciones utilizan sistemas de Gestión de Accesos Privilegiados (PAM, por sus siglas en inglés). Estos sistemas son esenciales para asegurar, gestionar y monitorear el uso de accesos privilegiados por parte de los administradores de sistemas, un aspecto fundamental para cumplir con las exigencias de auditoría que establecen las regulaciones de seguridad.
Entre las herramientas destacadas de los sistemas PAM se encuentran el registro de pulsaciones de teclas y las grabaciones de vídeo de las sesiones. No obstante, en sistemas operativos como Windows, donde predomina la interfaz gráfica, la captura de pulsaciones no siempre es viable. Esto limita el análisis de actividades a través de grabaciones de vídeo, un proceso desbordante ya que una típica organización financiera puede generar más de 100,000 horas de grabaciones mensuales.
Si tan solo el 30% de estas grabaciones proviene de servidores Windows, serían necesarios cerca de 1,000 empleados trabajando a jornada completa para revisarlas, lo que dificulta de sobremanera la detección de anomalías de seguridad o actividades maliciosas. Esta complejidad ha obligado a los equipos de seguridad a realizar controles aleatorios, poniendo en riesgo su capacidad para identificar infracciones de seguridad en tiempo real.
La irrupción de servicios de inteligencia artificial (IA) está revolucionando el procesamiento y análisis de contenidos de vídeo. Gracias a técnicas avanzadas de aprendizaje automático y visión por computadora, se están desarrollando funciones como la detección de objetos, el reconocimiento de actividades, y el reconocimiento de texto y audio. En este nuevo contexto, el uso de modelos de lenguaje de gran tamaño, como Claude 3 de Anthropic, ha permitido a las empresas transformar las grabaciones en transcripciones analizadas para detectar anomalías.
La propuesta implica un flujo de trabajo en dos etapas: la transcripción de los vídeos y el análisis de seguridad de esas transcripciones. Primero, se extraen imágenes estáticas de cada segundo de grabación, debido a las dificultades que los modelos actuales enfrentan al procesar datos visuales secuenciales. Posteriormente, las transcripciones son sometidas a análisis de seguridad para verificar solicitudes de cambio y detectar potenciales riesgos de acceso a datos sensibles o de elevación de privilegios.
La implementación de este enfoque, aprovechando tecnologías como Amazon Bedrock y Claude 3, no solo optimiza la gestión de las grabaciones, sino que también fortalece la postura de seguridad de las organizaciones frente a las amenazas. Este sistema eficiente para analizar grandes volúmenes de datos visuales permite a las empresas responder más rápidamente a incidentes de seguridad y asegurar el cumplimiento normativo de sus operaciones.
Este enfoque innovador puede sentar las bases para que otros sectores adopten estrategias similares, adaptando la tecnología a sus necesidades específicas y mejorando sus procesos de seguridad.