Cómo MSD Utiliza Amazon Bedrock para Traducir Lenguaje Natural en SQL para Bases de Datos Complejas en el Sector Salud

Elena Digital López

En un giro innovador para el acceso y análisis de datos en el sector de la salud, la inteligencia artificial generativa está revolucionando la interacción de las organizaciones de salud con su vasta cantidad de datos. Utilizando modelos de lenguaje a gran escala, ahora es posible extraer conocimientos valiosos de datos estructurados en sistemas de gestión de bases de datos relacionales, generando consultas SQL complejas a partir de preguntas en lenguaje natural. Este avance no solo facilita el análisis de datos para personas con distintos niveles de habilidad, sino que también permite a las organizaciones tomar decisiones basadas en datos de manera más rápida.

La farmacéutica global Merck & Co., Inc., conocida como MSD, ha sido pionera en la implementación de esta tecnología al colaborar con el Centro de Innovación en Generación AI de Amazon. Este socio tecnológico ha sido clave en el desarrollo de una solución que simplifica la extracción de datos complejos de bases de datos del sector salud. Antes de esta innovación, analistas y científicos de datos dedicaban mucho tiempo a crear manualmente consultas SQL, lo que ralentizaba la productividad y las decisiones informadas. Ahora, un analista solo necesita formular una pregunta como «¿Cuántas pacientes mujeres fueron admitidas en un hospital en 2008?» y el sistema generará automáticamente la consulta SQL adecuada, reduciendo potencialmente el tiempo de creación de consultas de horas a minutos. Este progreso no solo ahorra tiempo, sino que democratiza el acceso a los datos, permitiendo a personal no técnico extraer información rápidamente, mejorando la productividad y acelerando la toma de decisiones.

Aunque algunos modelos de lenguaje pueden generar código SQL, crear un flujo de trabajo efectivo de texto a SQL requiere precisión en las indicaciones y puede no ser viable con todos los modelos. Es esencial incluir toda la información necesaria de la base de datos para escribir consultas ejecutables, pues este contexto es fundamental para generar sentencias SQL precisas y específicas del esquema.

El sistema desarrollado por MSD utiliza el modelo Claude 3.5 Sonnet de Anthropic en Amazon Bedrock, un servicio administrado que proporciona modelos de generación de alto rendimiento de compañías líderes en inteligencia artificial. Para demostrar las capacidades de esta solución, se ha empleado el conjunto de datos de acceso público Data Entrepreneurs’ Synthetic Public Use File, que ofrece una estructura de datos de salud realista sin comprometer la privacidad del paciente.

El acceso avanzado a los datos en el sector salud es crucial para la competitividad futura, y el uso estratégico de la inteligencia artificial generativa es el camino para superar los desafíos de acceso a la información y análisis de datos ágil. Esta innovación representa no solo un avance tecnológico, sino también un paso significativo hacia mejores resultados para los pacientes y una excelencia operativa en el sector salud.

Scroll al inicio