Implementación Multi-tenant RAG con Bases de Conocimiento de Amazon Bedrock

Elena Digital López

En un mundo cada vez más enfocado en la personalización para lograr el éxito, las organizaciones están en la constante búsqueda de aprovechar sus conocimientos y experiencias del sector para adquirir una ventaja competitiva. La llegada de los modelos de base (FMs) y sus impresionantes capacidades de procesamiento del lenguaje natural han abierto una nueva ventana de oportunidad para sacar provecho de los activos de datos.

Las empresas están adoptando con mayor frecuencia la inteligencia artificial generativa con el objetivo de brindar experiencias personalizadas a sus clientes. Especializar el comportamiento de los FMs con datos propios y de los usuarios se ha convertido en una tarea esencial. En este contexto, la Generación Aumentada por Recuperación (RAG) ha surgido como un método simple y efectivo para alcanzar el nivel de especialización deseado.

Amazon Bedrock Knowledge Bases se presenta como una solución completamente gestionada que simplifica todo el flujo de trabajo de RAG, permitiendo a las organizaciones facilitar información contextual a los FMs y agentes desde fuentes de datos privadas. Así, se logran respuestas más precisas y adecuadas a las necesidades específicas de los usuarios.

Para los desarrolladores de productos multiarrendatarios, especialmente aquellos que son proveedores de software independiente (ISVs) que crean software como servicio (SaaS), la capacidad de personalizar las experiencias de cada uno de sus clientes es de especial importancia. La implementación de RAG facilita el uso selectivo de datos específicos para cada arrendatario, enfrentando desafíos como el aislamiento de datos, seguridad, gestión de arrendatarios y control de costos.

La arquitectura RAG integrada en la aplicación de los ISVs es un ejemplo concreto de cómo lograr esta personalización. Un componente crucial es el almacenamiento de datos en bases de vectores, donde actualmente se usa Amazon OpenSearch Service, aunque esta arquitectura se puede ajustar a otras soluciones similares.

Al desarrollar un sistema RAG multiarrendatario, las organizaciones deben tener en cuenta el aislamiento entre arrendatarios, la variabilidad, la simplicidad en la gestión de arrendatarios y la eficacia en costos. Equilibrar estos factores es crucial para la efectividad de la solución. Existen varios patrones propuestos: silo, pool y puente, ofreciendo diferentes niveles de aislamiento y personalización que se adaptan a diversas necesidades y casos de uso.

El patrón de silo destaca por su aislamiento, al implementar infraestructura totalmente separada para cada arrendatario. Aunque resulta más costoso, aporta independencia y seguridad en los datos. En contraste, el patrón de pool comparte la arquitectura RAG entre todos los arrendatarios, optimizando costos pero limitando la personalización específica. El patrón de puente, por su parte, busca un balance entre ambos, favoreciendo la personalización y una mejor optimización de costos respecto al patrón de silo.

Estos enfoques permiten que las organizaciones modifiquen su arquitectura tecnológica para ofrecer un servicio cada vez más personalizado, asegurando la satisfacción del cliente mientras maximizan el uso de sus recursos y datos disponibles.

Scroll al inicio