Volkswagen, el notable gigante automovilístico europeo, ha dado un audaz paso adelante en la gestión del conocimiento en el ámbito de la producción al adoptar una solución revolucionaria basada en inteligencia artificial generativa. Junto con el equipo de Prototipado e Ingeniería de Clientes de AWS (AWSI-PACE), Volkswagen ha lanzado un prototipo innovador empleando los avanzados modelos Claude 3 de Anthropic en Amazon Bedrock. Este prototipo permite extraer y analizar información de complejos documentos privados en formato PDF, que incorporan tanto texto como imágenes.
El desafío técnico principal para Volkswagen consistió en desarrollar un sistema capaz de manejar y procesar datos en un entorno multimodal, asegurando al mismo tiempo la precisión y accesibilidad de la información almacenada. La solución implementada, basada en la arquitectura de Recuperación de Generación Aumentada (RAG), permite a Volkswagen gestionar y acceder de manera eficiente a la información interna, incrementando así la precisión y eficiencia de sus operaciones productivas.
La infraestructura desarrollada emplea un sistema backend nativo sin servidor del entorno AWS, centrado en la eficiencia, escalabilidad y fiabilidad. Este marco incorpora varios servicios de AWS, como Amazon S3 para almacenamiento de datos, Amazon Kendra para búsqueda semántica, y Amazon Bedrock para análisis e inferencia de datos. Los modelos de visión Claude 3, dentro de Amazon Bedrock, desempeñan un papel crucial en la comprensión y análisis de imágenes junto con el texto, lo cual es esencial para extraer información de documentos complejos.
El flujo de trabajo del sistema inicia cuando un usuario carga un documento PDF mediante la interfaz web proporcionada por Amazon CloudFront. Una vez cargado, el documento se almacena en Amazon S3, donde Amazon Kendra comienza a indexar el texto. Simultáneamente, una función Lambda extrae imágenes de los documentos, y estas son procesadas por Amazon Bedrock para extraer texto contextual relevante, que se almacena nuevamente en S3 y posteriormente indexado por Amazon Kendra para mejorar la capacidad de búsqueda y consulta.
El sistema demuestra una impresionante capacidad multilingüe, gestionando documentos en alemán y permitiendo consultas en alemán e inglés. Este avance es crucial para los usuarios que interactúan con documentos en múltiples idiomas, al permitirles realizar consultas en su idioma de preferencia y mejorando, por tanto, la experiencia del usuario.
Los resultados del prototipo han sido notables. No solo se ha logrado un proceso de búsqueda semántica más preciso y contextualmente relevante, sino que también se ha proporcionado una experiencia de usuario mejorada gracias a la integración de capacidades multilingües. Estas características han ampliado considerablemente el alcance y la accesibilidad del sistema para los usuarios de Volkswagen.
Stefan Krawinkel, representante de Volkswagen, expresó su satisfacción con los resultados logrados, destacando el espíritu innovador del equipo de AWS y la capacidad de la inteligencia artificial generativa para enfrentar complejos desafíos y redefinir fronteras tecnológicas. La colaboración no solo ha permitido superar barreras actuales, sino que también ha abierto nuevas posibilidades para innovaciones futuras en el sector automotriz.