En un esfuerzo por integrar la inteligencia artificial generativa de manera más efectiva en el mundo empresarial, el AWS Generative AI Innovation Center (GenAIIC) ha dado un paso significativo al configurar un equipo multidisciplinario de expertos enfocados en el desarrollo de soluciones de Prueba de Concepto. Desde su inicio en mayo de 2023, la demanda de chatbots que no solo respondan preguntas, sino que también extraigan y generen información a partir de vastas y variadas bases de conocimiento, ha crecido exponencialmente.
Un concepto fundamental introducido por GenAIIC es la Generación Aumentada por Recuperación (RAG), que fusiona modelos de lenguaje avanzados con datos externos para mejorar la precisión y relevancia de las respuestas. Este método se esfuerza por recabar información precisa, enriquecerla con la interacción del usuario y generar respuestas coherentes y útiles.
Recientemente, GenAIIC ha comenzado a publicar una serie de artículos que buscan familiarizar a los usuarios con la aplicación de RAG. Estos artículos iniciales se centran en explicar la arquitectura básica y cómo manejar eficientemente el texto en estos sistemas. En futuras entregas, se espera abordar la interoperabilidad con diferentes tipos de datos, incluyendo formatos tabulares y visuales.
Un aspecto crítico es la eficiencia en la recuperación de información, ya que de esto depende en gran medida la precisión de las respuestas generadas por los RAG. Se sugiere el uso de almacenes vectoriales que permiten convertir textos en vectores, facilitando así búsquedas semánticas avanzadas. Sin embargo, no se descarta la utilidad de búsquedas por palabras clave, especialmente para terminología técnica y nombres propios.
GenAIIC también presenta aplicaciones prácticas de esta tecnología en diversas áreas, como el servicio al cliente, el entrenamiento laboral, el mantenimiento industrial, la búsqueda de información de productos y la síntesis de noticias financieras, demostrando así la versatilidad de los RAG en diferentes sectores.
Para garantizar la calidad tanto en la recuperación como en la generación de respuestas, se han propuesto métricas de evaluación, tales como precisión, recuerdo y análisis por expertos. Además, se ofrecen sugerencias para mejorar la calidad de lo generado, como la ingeniería de prompts, la generación de citas y su verificación con los documentos originales.
Asimismo, se subraya que, pese al potente alcance de los modelos de lenguaje, la calidad final de las respuestas depende crucialmente del contexto proporcionado durante la recuperación de datos. La evaluación y optimización continua de la arquitectura RAG es vital para su eficacia y aceptación generalizada.
AWS facilita la creación de estos chatbots RAG mediante servicios como Amazon Bedrock Knowledge Bases, que se integran con Amazon S3. Esta vinculación automatiza el indexado y fragmentación de documentos, ofreciendo a las empresas una vía accesible para innovar usando la inteligencia artificial generativa. En un futuro, se anticipa que estos avances impulsarán la gestión y uso de datos más estructurados y visuales mediante soluciones multimodales.