Magentic-One: el sistema multiagente de Microsoft que revoluciona la resolución de tareas complejas

Microsoft ha lanzado Magentic-One, un sistema multiagente generalista diseñado para abordar tareas abiertas y complejas en entornos web y basados en archivos. Este avance marca un paso significativo en el desarrollo de agentes de inteligencia artificial capaces de llevar a cabo tareas cotidianas tanto en el ámbito laboral como personal. La implementación de Magentic-One está disponible en código abierto a través de Microsoft AutoGen, un marco de referencia para la creación de aplicaciones multiagente.

Inteligencia artificial “agéntica”: el próximo salto en la IA

La tendencia actual en IA se dirige hacia sistemas “agénticos”, capaces no solo de responder a consultas, sino también de llevar a cabo acciones de forma autónoma. Estos agentes pueden navegar en internet, gestionar archivos o ejecutar código, con aplicaciones que van desde la ingeniería de software hasta la investigación científica. Magentic-One tiene como objetivo convertirse en una herramienta generalista que realice múltiples tareas complejas en distintos entornos, permitiendo a los usuarios una experiencia de automatización más avanzada.

Magentic-One: un sistema multiagente de alto rendimiento

El sistema de Magentic-One utiliza una arquitectura de agentes múltiples, liderada por un agente principal denominado “Orquestador”. Este agente se encarga de descomponer la tarea en subtareas, asignarlas a agentes específicos y supervisar el progreso. Entre los agentes complementarios de Magentic-One se encuentran:

  • WebSurfer: capaz de interactuar con un navegador, visitar URL, realizar búsquedas y acciones en páginas web.
  • FileSurfer: diseñado para navegar y gestionar archivos en el sistema local, con habilidades para previsualizar documentos y manipular archivos.
  • Coder: un agente especializado en escribir código y realizar análisis basados en los datos recopilados por otros agentes.
  • ComputerTerminal: permite a Magentic-One ejecutar código en una consola y gestionar la instalación de librerías.

Esta estructura modular permite que los desarrolladores añadan o eliminen agentes sin afectar al sistema completo, lo que proporciona una flexibilidad que los sistemas monolíticos no pueden ofrecer.

Proyecto AutoGen y su evaluación con AutoGenBench

Para medir el rendimiento de Magentic-One, Microsoft ha desarrollado AutoGenBench, una herramienta de evaluación de código abierto que permite realizar pruebas exhaustivas en tareas de múltiples pasos y que requieren planificación. A través de AutoGenBench, se ha comprobado que Magentic-One alcanza un rendimiento competitivo en varias pruebas de referencia, como GAIA y AssistantBench, en comparación con otros modelos de última generación.

Seguridad y riesgos en sistemas agénticos

La naturaleza avanzada de los sistemas agénticos como Magentic-One plantea riesgos potenciales. Durante las pruebas de desarrollo, se observaron ciertos desafíos de control, como intentos repetidos de login que llevaron a la suspensión de una cuenta o acciones no deseadas en redes sociales. Microsoft ha implementado salvaguardias para minimizar estos riesgos, incluidas pruebas de seguridad y medidas de supervisión humana para casos de uso en producción.

benchmark magnetic one

Futuro de los sistemas agénticos: hacia una IA más segura y eficiente

El desarrollo de Magentic-One es solo el comienzo en la búsqueda de sistemas agénticos seguros y eficientes. Microsoft continuará trabajando en la mejora de los mecanismos de seguridad y la investigación en IA responsable, con el objetivo de crear un ecosistema de inteligencia artificial que contribuya a la productividad y seguridad en aplicaciones de múltiples dominios.

vía: Microsoft

Scroll al inicio