Microsoft amplía desde hoy la elección de modelos que impulsan Microsoft 365 Copilot con la incorporación de Claude Sonnet 4 y Claude Opus 4.1 de Anthropic. La compañía mantiene a OpenAI como base —con sus modelos más recientes—, pero suma una segunda familia para dar flexibilidad a empresas y equipos que buscan ajustar rendimiento, coste y comportamiento de los agentes a casos de uso concretos.
La novedad aterriza en dos frentes: el agente Researcher dentro de Copilot y Copilot Studio, la plataforma para crear y orquestar agentes empresariales. En ambos casos, la promesa es la misma: modelo a la carta, sin saltar de plataforma ni multiplicar la complejidad operativa.
“Researcher” con elección de modelo: razonamiento profundo para trabajos largos
Researcher —presentado como un agente de razonamiento para tareas multietapa— puede funcionar ahora con modelos de OpenAI o con Claude Opus 4.1. La idea es cubrir trabajos que exigen análisis denso y trazable: elaborar un go-to-market detallado, analizar tendencias de producto emergentes o armar un informe trimestral sólido.
La utilidad práctica está en el alcance de las fuentes: Researcher razona no solo sobre la web y proveedores de datos de terceros, sino también sobre el contenido de trabajo del propio cliente —correos, chats, reuniones, archivos y más— para ofrecer ayuda experta bajo demanda. Con el cambio, cada organización puede optar por el modelo que mejor encaje con su estilo de redacción, su tono de interlocución y su política de seguridad.
Microsoft puntualiza que Claude en Researcher llega mediante un programa de opt-in (Frontier Program) para clientes con licencia de Microsoft 365 Copilot. Una vez activado, se puede alternar entre OpenAI y Anthropic sin fricción.
Copilot Studio: agentes con Claude Sonnet 4 y Opus 4.1
En Copilot Studio, los modelos de Anthropic aparecen como opciones en el selector de modelos. El objetivo: crear, personalizar y gestionar agentes de nivel empresarial que combinen razonamiento, automatización de flujos y tareas agenticas más flexibles.
La plataforma permite, además, arquitecturas multiagente y herramientas de prompting que mezclan modelos especializados: es posible asignar, por ejemplo, OpenAI para generación creativa, Anthropic para razonamiento y cumplimiento más conservador, y recurrir a otros modelos del Azure Model Catalog para subtareas específicas (clasificación, extracción, traducción, etc.). Esta interoperabilidad busca evitar el bloqueo de proveedor, a la vez que mantiene la gobernanza centralizada.
Un matiz operativo relevante: los modelos de Anthropic se alojan fuera de entornos gestionados por Microsoft y quedan sujetos a los Términos de Servicio de Anthropic. Para habilitar el acceso, el administrador debe opt-in desde el Centro de administración de Microsoft 365. Es un diseño consciente de las fronteras de responsabilidad (datos, logging, retención, cumplimiento) que conviene revisar en proyectos regulados.
Por qué importa este movimiento
- Elección técnica real: no todos los LLM se comportan igual. Hay diferencias en estilo, robustez frente a prompting, tendencia a alucinar, razonamiento paso a paso o cumplimiento de instrucciones. Llevar esa elección donde está el trabajo (Microsoft 365) reduce fricciones y ahorra cambios de herramienta.
- Agentes más componibles: la mezcla de modelos por tarea en Copilot Studio habilita patrones multiagente más ricos (coordinador + especialistas) sin construir una plataforma propia. Es, en la práctica, MLOps aplicado a agentes.
- Gobernanza y seguridad: el encapsulado empresarial de Copilot (registros, permisos, políticas, auditoría) se mantiene, aunque cada modelo aporta sus propias garantías y condiciones de servicio. El trabajo del administrador será elegir y documentar qué se usa, para qué, con qué salvaguardas y bajo qué jurisdicción.
- Iteración rápida: Microsoft adelanta que esto es “solo el principio” y que seguirá incorporando innovaciones del sector a Copilot “a velocidad”. La curva de mejora de los modelos —y la competencia entre proveedores— se traslada así al puesto de trabajo.
Qué deberían tener en cuenta las organizaciones
- Política de modelos: decidir cuándo usar OpenAI o Anthropic (o ambos), para qué tipos de tareas y con qué datos. En sectores regulados, fijar límites por tipo de información y riesgo.
- Pruebas con datos propios: los benchmarks públicos no sustituyen ensayos con documentos, correos y procesos reales. Comparar calidad, tiempo de respuesta, coste y auditable (trazabilidad).
- Multiagente con cabeza: no por poder orquestar muchos agentes conviene hacerlo. Definir roles, handoffs y métricas (tasa de éxito por tarea, intervenciones humanas, tiempo medio).
- Cumplimiento y contratos: si se usan modelos alojados fuera del entorno de Microsoft, revisar términos, retención, telemetría y canales de soporte. Documentar el RACI (quién responde de qué).
Impacto para usuarios finales
Para el empleado, el cambio se percibe en dos niveles:
- Researcher podrá adaptarse mejor al tipo de análisis o redacción que se necesita, con alternancia de modelo al vuelo.
- En Copilot Studio, los agentes internos pueden mejorar su razonamiento y automatización, al apoyarse en el modelo más apto para cada paso del flujo.
La clave es que la elección de modelo deja de ser una decisión de arquitectura aislada y pasa a formar parte de la experiencia de productividad.
Qué llega hoy y qué queda por venir
- Disponible ya: Claude en Researcher (vía Frontier Program y opt-in para clientes con licencia de Microsoft 365 Copilot) y Claude Sonnet 4 / Opus 4.1 como opciones de modelo en Copilot Studio.
- Activación: el administrador debe habilitar el acceso en el Centro de administración.
- En el horizonte: Microsoft anticipa más experiencias impulsadas por modelos de Anthropic dentro de Microsoft 365 Copilot y nuevas incorporaciones del catálogo de Azure según avance el mercado.
Lectura estratégica
En plena guerra por el razonamiento profundo y los agentes, Microsoft mueve ficha hacia un Copilot multi-modelo donde la ventaja no está en atar al cliente a un único proveedor, sino en orquestar el modelo adecuado en el momento adecuado, dentro de la suite donde sucede el trabajo. Para las empresas, la cuestión deja de ser “qué modelo es mejor” y pasa a ser “qué combinación me da mejores resultados con mis datos, mis procesos y mis controles”.
vía: microsoft