微软推出 Magentic-One:多 AI 智能体协同完成复杂任务

微软本月发布 Magentic-One 系统,通过协调多个专用 AI 智能体,高效处理复杂工作流程。

微软本月发布 Magentic-One 系统,通过协调多个专用 AI 智能体,高效处理复杂工作流程。

Magentic-One 系统隶属于 AutoGen 开源平台,在不同环境中无缝编排任务,进一步巩固了微软在 AI 任务自动化中的地位。

AI在线注:Magnetic-One 的核心是协调器代理(Orchestrator),它负责管理框架内的多个子智能体,该协调器不仅是任务调度器,更是高效完成任务的蓝图设计者。

微软推出 Magentic-One:多 AI 智能体协同完成复杂任务

该协调器通过构建“任务账本”(task ledger)来启动操作,并在项目进展中维护“进度账本”(progress ledger),确保每个阶段的任务都能按时完成。

Magnetic-One 通过协调器指挥四个主要代理,各自承担不同的角色,共同实现任务的无缝执行:

  • WebSurfer 智能体:负责在网络上进行搜索、点击链接和与在线元素互动,能够跨多个网站收集信息并提供所需摘要。

  • FileSurfer 智能体:探索本地目录、分析文件内容,支持文档管理和数据检索,确保重要文件的顺利整合。

  • 编码智能体:具备编写和评估代码的能力,能够撰写新脚本、调试现有代码,并与其他代理协作。

  • 计算机终端智能体:直接执行由编码代理生成的代码,适用于需要即时测试或部署的项目。

微软推出 Magentic-One:多 AI 智能体协同完成复杂任务

协调器的自适应特性使其能够监控项目的每个阶段,及时调整计划以应对障碍。如果某个代理在特定步骤上遇到困难,协调器会重新分配任务或更新策略,确保项目持续推进。这种灵活性使 Magnetic-One 在任务执行中展现出人类般的适应能力。

微软推出 Magentic-One:多 AI 智能体协同完成复杂任务

微软推出 Magentic-One:多 AI 智能体协同完成复杂任务

相关资讯

微软开源创新框架:可将DeepSeek,变成AI Agent

微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0,可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,变成可在计算机使用的AI Agent。 与V1版本相比,V2在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。 在高分辨率Agent基准测试ScreenSpot Pro中,V2 GPT-4o的准确率达到了惊人的39.6%,而GPT-4o原始准确率只有0.8%,整体提升非常大。

微软开源多模态AI基础模型!无需额外微调轻松拿捏网页、机器人

微软研究院官宣开源多模态AI——Magma模型。 首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。 该模型近期已被计算机视觉顶会CVPR接收,只要给定一个目标描述,Magma就能制定计划、执行行动,无论是在数字界面中还是物理世界里,都能展现出灵活而高效的交互能力。

两个用于科研的开源 AI Agent,改变知识研究的方式

想象一下,如果可以让爱因斯坦、埃隆·马斯克、费曼、史蒂夫·乔布斯、简·古道尔和尤瓦尔·诺亚·赫拉利和你一起合作共同研究并编写研究报告,这是一种什么感受? 我们每天产生的信息比过去一年产生的信息还要多,假如研究人员想在一个小时内访问一万个网站、研究分析数据、并编写报告,这实际上是不可能的。 如今,随着AI 大模型技术的发展,使用AI Agent却可以轻松地做到这一点。