Microsoft ha lanzado Magentic-One, un sistema multiagente generalista diseñado para abordar tareas abiertas y complejas en entornos web y basados en archivos. Este avance marca un paso significativo en el desarrollo de agentes de inteligencia artificial capaces de llevar a cabo tareas cotidianas tanto en el ámbito laboral como personal. La implementación de Magentic-One está disponible en código abierto a través de Microsoft AutoGen, un marco de referencia para la creación de aplicaciones multiagente.
Inteligencia artificial “agéntica”: el próximo salto en la IA
La tendencia actual en IA se dirige hacia sistemas “agénticos”, capaces no solo de responder a consultas, sino también de llevar a cabo acciones de forma autónoma. Estos agentes pueden navegar en internet, gestionar archivos o ejecutar código, con aplicaciones que van desde la ingeniería de software hasta la investigación científica. Magentic-One tiene como objetivo convertirse en una herramienta generalista que realice múltiples tareas complejas en distintos entornos, permitiendo a los usuarios una experiencia de automatización más avanzada.
Magentic-One: un sistema multiagente de alto rendimiento
El sistema de Magentic-One utiliza una arquitectura de agentes múltiples, liderada por un agente principal denominado “Orquestador”. Este agente se encarga de descomponer la tarea en subtareas, asignarlas a agentes específicos y supervisar el progreso. Entre los agentes complementarios de Magentic-One se encuentran:
- WebSurfer: capaz de interactuar con un navegador, visitar URL, realizar búsquedas y acciones en páginas web.
- FileSurfer: diseñado para navegar y gestionar archivos en el sistema local, con habilidades para previsualizar documentos y manipular archivos.
- Coder: un agente especializado en escribir código y realizar análisis basados en los datos recopilados por otros agentes.
- ComputerTerminal: permite a Magentic-One ejecutar código en una consola y gestionar la instalación de librerías.
Esta estructura modular permite que los desarrolladores añadan o eliminen agentes sin afectar al sistema completo, lo que proporciona una flexibilidad que los sistemas monolíticos no pueden ofrecer.
Proyecto AutoGen y su evaluación con AutoGenBench
Para medir el rendimiento de Magentic-One, Microsoft ha desarrollado AutoGenBench, una herramienta de evaluación de código abierto que permite realizar pruebas exhaustivas en tareas de múltiples pasos y que requieren planificación. A través de AutoGenBench, se ha comprobado que Magentic-One alcanza un rendimiento competitivo en varias pruebas de referencia, como GAIA y AssistantBench, en comparación con otros modelos de última generación.
Seguridad y riesgos en sistemas agénticos
La naturaleza avanzada de los sistemas agénticos como Magentic-One plantea riesgos potenciales. Durante las pruebas de desarrollo, se observaron ciertos desafíos de control, como intentos repetidos de login que llevaron a la suspensión de una cuenta o acciones no deseadas en redes sociales. Microsoft ha implementado salvaguardias para minimizar estos riesgos, incluidas pruebas de seguridad y medidas de supervisión humana para casos de uso en producción.
Futuro de los sistemas agénticos: hacia una IA más segura y eficiente
El desarrollo de Magentic-One es solo el comienzo en la búsqueda de sistemas agénticos seguros y eficientes. Microsoft continuará trabajando en la mejora de los mecanismos de seguridad y la investigación en IA responsable, con el objetivo de crear un ecosistema de inteligencia artificial que contribuya a la productividad y seguridad en aplicaciones de múltiples dominios.
vía: Microsoft