Construye Aplicaciones RAG Rentables con Binarios Embeddings en Amazon Titan Text Embeddings V2, Amazon OpenSearch Serverless y Amazon Bedrock Knowledge Bases

Elena Digital López

Hoy se ha revelado una nueva funcionalidad en el ámbito de la inteligencia artificial que promete revolucionar la creación de aplicaciones empresariales: las incrustaciones binarias para las Amazon Titan Text Embeddings V2 ya están disponibles en las Amazon Bedrock Knowledge Bases y en Amazon OpenSearch Serverless. Este avance permitirá a las empresas desarrollar aplicaciones de Recuperación y Generación Aumentada (RAG) más eficientes, reduciendo significativamente el uso de memoria y los costos operativos asociados.

La novedad radica en la capacidad de las Amazon Titan Text Embeddings V2 para generar representaciones semánticas avanzadas con dimensiones configurables de 1,024, 512 o 256 bits. Ahora, incorporan la opción de incrustaciones binarias, que permiten almacenar información como vectores binarios, optimizando así el espacio de almacenamiento y las operaciones computacionales.

Adicionalmente, la opción sin servidor de Amazon OpenSearch ha mejorado las características de búsqueda, ofreciendo soporte para algoritmos de vecino más cercano tanto exactos como aproximados. Esto no solo facilita una búsqueda mucho más veloz, sino que también hace más económico el almacenamiento de vectores al aprovechar los índices binarios.

Los beneficios de esta innovación han sido evidenciados en un benchmark utilizando el conjunto de datos Massive Text Embedding Benchmark (MTEB), el cual mostró una mejora asombrosa de 25 veces en la latencia. La precisión de recuperación ha permanecido en un 98.5% con reordenamiento y al 97% sin él, cifras que casi igualan las obtenidas por incrustaciones de precisión completa.

Más aún, las pruebas con el algoritmo de proximidad HNSW han identificado una reducción del 50% en las Unidades Computacionales que exige OpenSearch, lo cual aumenta aún más los ahorros potenciales en costos. Al emplear distancias de Hamming, este enfoque socializa una eficiencia computacional superior, en comparación con métodos tradicionales que demandan más recursos.

Esta nueva característica se ha puesto a disposición en todas las regiones de AWS que cuentan con los servicios de Amazon Bedrock y Amazon OpenSearch Serverless. Los usuarios interesados pueden comenzar a disfrutar de los beneficios de esta tecnología al iniciar sesión en la consola de Amazon Bedrock. Además, se les invita a unirse a la comunidad AWS para aportar su retroalimentación y participar en las conversaciones en torno a la inteligencia artificial generativa.

Para obtener información más detallada sobre cómo implementar estas herramientas avanzadas, se recomienda consultar la documentación oficial y los recursos disponibles en el sitio web de AWS.

Scroll al inicio