Amazon Bedrock ha anunciado una nueva característica clave llamada «filtro de metadatos» y ha cambiado su motor predeterminado, permitiendo el uso de campos de metadatos durante el proceso de recuperación de datos. Esta actualización, anunciada el 27 de marzo de 2024, supone un avance significativo para las empresas que utilizan la técnica de Generación Aumentada por Recuperación (RAG) para dotar a los modelos de base con información precisa y actualizada.
Amazon Bedrock es un servicio totalmente gestionado que ofrece modelos de base de alto rendimiento de compañías líderes en inteligencia artificial como AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, Stability AI y Amazon, a través de una sola API. Para facilitar la implementación del flujo de trabajo completo de RAG, desde la ingestión hasta la recuperación y la ampliación del prompt, Bedrock ofrece la funcionalidad de Knowledge Bases, la cual ahora soporta el uso de metadatos.
El proceso de implementación de esta solución se divide en tres pasos principales: preparación de los datos para el filtrado de metadatos, creación e ingestión de datos y metadatos en la base de conocimientos, y la recuperación de datos usando este filtro de metadatos. Para demostrar este proceso, se utilizó un conjunto de datos públicos de Food.com sobre recetas y reseñas, de los cuales se procesaron las 2,000 filas principales.
La característica de filtrado de metadatos es especialmente útil cuando se trabaja con datos tabulares donde los detalles de un campo están disponibles en otro campo. También permite citar documentos o campos de texto exactos para prevenir errores. En el caso expuesto, se realizaron consultas para encontrar recetas con tiempos de preparación y niveles de colesterol específicos, demostrando que los resultados con filtrado de metadatos eran significativamente más precisos que sin él.
En resumen, Amazon Bedrock ahora ofrece una funcionalidad mejorada y herramientas avanzadas para el manejo de datos en RAG, lo que permitirá a las organizaciones obtener resultados más relevantes y precisos en sus modelos de inteligencia artificial. Tanay Chowdhury, Científico de Datos en el Centro de Innovación en IA Generativa de Amazon Web Services, destacó la importancia de esta actualización y cómo puede beneficiar a las empresas en la resolución de problemas mediante el uso de IA generativa y aprendizaje automático.
vía: AWS machine learning blog