Microsoft ha publicado una versión de referencia de código abierto que permite a las empresas desplegar su propio ChatGPT corporativo, aislado de OpenAI y conectado a sus propias fuentes de datos. La solución combina el servicio Azure OpenAI con la Búsqueda Cognitiva de Azure (Azure Cognitive Search) para implementar el patrón RAG (Retrieval Augmented Generation, o Generación Aumentada por Recuperación), que permite al modelo responder preguntas usando documentos internos de la empresa en lugar de su conocimiento genérico de entrenamiento.
El repositorio, disponible en GitHub como azure-search-openai-demo, es una implementación de muestra que Microsoft ofrece a desarrolladores y empresas como punto de partida para construir asistentes internos de IA. No es un producto empaquetado listo para usar, sino una arquitectura de referencia que los equipos técnicos pueden adaptar a su infraestructura y sus datos.
Qué resuelve el patrón RAG de Azure
El problema que aborda esta arquitectura es concreto: las empresas no quieren que sus empleados usen ChatGPT público para consultas internas porque los datos pueden usarse para entrenar modelos de OpenAI y salen del entorno controlado de la empresa. Con la solución de Azure, los datos se quedan en la infraestructura de Azure de la empresa, el modelo de lenguaje (ChatGPT) se accede a través del servicio Azure OpenAI (no de openai.com directamente) y las respuestas se generan siempre a partir de documentos propios indexados.
El flujo es el siguiente: el empleado hace una pregunta, Azure Cognitive Search recupera los fragmentos relevantes de los documentos internos indexados y ese contexto se envía al modelo junto con la pregunta para que genere una respuesta fundamentada. El resultado es un asistente que puede responder sobre políticas internas, manuales de producto, contratos o cualquier documentación que la empresa haya indexado.

La demo de Contoso Electronics
Microsoft ha preparado una demostración usando una empresa ficticia, Contoso Electronics, que ilustra el caso de uso típico. Los empleados pueden hacer preguntas sobre beneficios laborales, políticas internas, descripciones de puestos y roles usando una interfaz de chat. La demo incluye herramientas para evaluar la fiabilidad de las respuestas y monitorear el rendimiento con Application Insights.
Hay que tener en cuenta que los documentos PDF incluidos en la demo contienen información generada por un modelo de lenguaje y son solo para fines ilustrativos; no reflejan datos reales de Microsoft ni de ninguna empresa.
Qué necesita una empresa para desplegarlo
Los requisitos técnicos para ejecutar la arquitectura de referencia son los siguientes: suscripción de Azure con acceso habilitado al servicio Azure OpenAI (que aún requiere solicitud aprobada en el momento del lanzamiento), Azure Developer CLI, Python 3.9 o superior, Node.js 14 o superior, Git y PowerShell 7 o superior. Para equipos sin experiencia en Azure, la curva de configuración inicial puede ser importante.
Los costes dependen del uso de Azure OpenAI (facturado por tokens) y de Azure Cognitive Search (facturado por índice y búsquedas). Microsoft ofrece la calculadora de precios de Azure para estimar el gasto antes de desplegar. En cargas de uso moderadas, el coste mensual de infraestructura puede ser sustancial para empresas pequeñas.
El movimiento se enmarca en la estrategia de Microsoft de llevar IA corporativa a través de Azure, que ha intensificado desde la apertura de las APIs de ChatGPT y Whisper de OpenAI. El acuerdo entre ambas compañías, que ha evolucionado hacia un modelo con menos exclusividad y más libertad cloud, sigue siendo el eje sobre el que se apoya esta arquitectura.
Preguntas frecuentes sobre Azure ChatGPT
¿Qué diferencia hay entre Azure ChatGPT y el ChatGPT de OpenAI?
La principal diferencia es la privacidad y el control de datos. Con Azure ChatGPT los datos de la empresa no salen al entorno de OpenAI, el modelo accede a los documentos internos indexados en Azure y el tráfico queda dentro de la infraestructura de Azure de la empresa.
¿Qué es el patrón RAG?
RAG (Retrieval Augmented Generation) es una técnica que combina la búsqueda de información con la generación de texto. El modelo de lenguaje no responde solo con su conocimiento de entrenamiento, sino que recibe fragmentos relevantes de documentos reales recuperados por un motor de búsqueda antes de generar la respuesta.
¿Azure ChatGPT es un producto de pago o gratuito?
El código de referencia es gratuito y de código abierto. Los costes provienen de los servicios de Azure que se usen: Azure OpenAI (por tokens) y Azure Cognitive Search (por índice y consultas). El coste real depende del volumen de uso.
¿Cuáles son los casos de uso típicos para una empresa?
Asistentes de RRHH que responden sobre políticas y beneficios, chatbots de soporte interno sobre manuales de producto, herramientas de búsqueda en bases de conocimiento legales o técnicas y asistentes de ventas con acceso a catálogos actualizados son los usos más habituales en las primeras implementaciones.












