La inteligencia artificial generativa está revolucionando la automatización en el ámbito empresarial, permitiendo que los sistemas de IA comprendan el contexto, tomen decisiones y actúen de manera autónoma. Dentro de este contexto, los modelos de IA generativa se han convertido en herramientas poderosas para resolver problemas empresariales complejos. Amazon Web Services (AWS) está capitalizando estos modelos mediante Amazon Bedrock para mejorar la automatización de procesos complicados de optimizar.
Una de las áreas donde la IA generativa muestra su potencial es en el procesamiento documental, una tarea tradicionalmente compleja que abarca documentos estructurados, semi-estructurados y no estructurados. Los documentos estructurados, como formularios con campos fijos, son más fáciles de manejar. Sin embargo, los documentos semi-estructurados, que contienen un conjunto de información predecible aunque su presentación varía, y los no estructurados, como notas o párrafos de texto, presentan mayores desafíos.
Históricamente, gestionar estos diversos tipos de documentos ha sido problemático para muchas organizaciones. Los sistemas basados en reglas y los modelos de aprendizaje automático especializados a menudo fallan ante la variabilidad de estos documentos en el mundo real, especialmente con datos semi-estructurados y no estructurados.
AWS ha desarrollado una solución de procesamiento documental inteligente utilizando los modelos de Amazon Bedrock para gestionar flujos de trabajo complejos. Esta solución permite el uso de herramientas externas a través de la API Converse de Bedrock, facilitando que los modelos no solo procesen texto, sino que también interactúen con una variedad de herramientas y API externas para realizar análisis documental.
El enfoque implementado es multi-modelo, optimizando tanto el rendimiento como los costos mediante la selección del modelo más adecuado para cada tarea. Un ejemplo es Claude 3 Haiku de Anthropic, que actúa como el orquestador del flujo de trabajo, coordinando la pipeline de procesamiento, tomando decisiones de enrutamiento, y gestionando el estado del flujo. Otro modelo, Claude 3.5 Sonnet, es empleado por sus capacidades avanzadas de razonamiento y procesamiento visual, lo que lo hace ideal para interpretar diseños complejos de documentos y extraer información de tablas y gráficos. La comunicación entre estos modelos se lleva a cabo de manera eficiente mediante la API Converse de Amazon Bedrock.
En la práctica, un ejemplar caso de uso es el procesamiento de un paquete de información de salud de un paciente en una consulta médica. Este flujo de trabajo permite extraer y sintetizar información de los tres tipos de documentos mencionados, mejorando la precisión de los datos y optimizando la eficiencia operativa.
La integración de guardrails de Amazon Bedrock en la solución asegura políticas sólidas de filtrado de contenido, detectando y enmascarando información sensible como datos de salud personal e identificativos, crucial para cumplir con las normativas del sector salud.
En resumen, esta innovadora solución de procesamiento documental inteligente demuestra el potencial de combinar modelos de fundamentos de IA generativa con capacidades de uso de herramientas para crear flujos de trabajo sofisticados y auto-orquestados. Al integrar modelos especializados, AWS ha demostrado la capacidad de manejar documentos estructurados, semi-estructurados y no estructurados con notable precisión y cumplimiento normativo. La evolución constante de Amazon Bedrock promete integrar características avanzadas que mejorarán aún más la eficiencia y la aplicación de estas soluciones en diversos sectores.