Las empresas están mostrando un creciente interés en la generación aumentada por recuperación (RAG), y los «vectores de embeddings» se han convertido en un elemento clave en este ámbito. Sin embargo, al incrementar su escala, se enfrentan a retos significativos relacionados con los costos. A medida que aumentan las bases de conocimiento, se necesitan embeddings más detallados. Muchos sistemas de bases de datos de vectores, que dependen de almacenamiento de alto rendimiento como SSD o soluciones en memoria, pueden llegar a ser muy costosos. Esta barrera de costos obliga frecuentemente a las organizaciones a reducir el alcance de sus aplicaciones RAG o a comprometer la calidad de sus representaciones vectoriales.
A partir del 15 de julio, los clientes de Amazon Bedrock Knowledge Bases pueden optar por utilizar Amazon S3 Vectors, actualmente en fase de vista previa. Esta es la primera solución de almacenamiento en la nube que ofrece soporte para almacenar y consultar vectores a un costo reducido. Los usuarios de Amazon Bedrock pueden disminuir los costos de carga, almacenamiento y consulta de vectores en un 90%. Diseñados para el almacenamiento duradero y rentable de grandes conjuntos de datos vectoriales, los S3 Vectors son ideales para aplicaciones RAG que requieren almacenamiento a largo plazo y pueden tolerar un rendimiento menor en comparación con las bases de datos vectoriales de baja latencia.
La integración de Amazon S3 Vectors con Amazon Bedrock Knowledge Bases facilita crear aplicaciones RAG más económicas mientras se mantiene la calidad en la búsqueda semántica. Este nuevo enfoque permite a las empresas escalar sus bases de conocimiento para manejar millones de documentos sin incurrir en altos costos de infraestructura compleja.
El proceso de integración con Amazon S3 Vectors es accesible e incluye varios pasos, desde la creación de la base de conocimiento hasta la prueba de sus capacidades de recuperación. La opción de crear rápidamente un nuevo almacén de vectores simplifica la gestión y optimiza los costos de almacenamiento.
Además, S3 Vectors permite configurar la fuente de datos con un enfoque sencillo para procesar documentos e incluir metadatos utilizados para refinar consultas. Esto subraya la importancia de elegir correctamente las opciones de procesamiento y fragmentación que se ajusten a las necesidades de recuperación de contenido.
La posibilidad de validar la funcionalidad de la base de conocimiento mediante una interfaz de prueba incorporada permite a los usuarios experimentar con diferentes tipos de consultas y obtener información relevante de manera efectiva. Por último, la opción de crear una base de conocimiento de manera programática utilizando el AWS SDK brinda a las organizaciones una flexibilidad aún mayor para integrar esta innovación en sus procesos existentes.
La implementación conjunta de Amazon Bedrock Knowledge Bases y Amazon S3 Vectors representa un avance importante para que las aplicaciones RAG sean más accesibles y económicamente viables, permitiendo a las organizaciones enfocarse en el valor que pueden crear a través de aplicaciones impulsadas por inteligencia artificial.