Agent

关于大模型智能体意图识别不准确问题：function call 的缺陷

最近在研究大模型智能体也就是Agent的过程中，遇到了一个很严重的问题，直接影响到Agent的质量和效果；那就是意图识别不准确，也可以说是Agent的幻觉问题。其产生的原因就在于大模型有时无法准确识别出用户意图，无法准确调用相应的函数。意图识别不准确现在大模型技术在应用方面，主要有两大方向；其一就是大模型的创作能力，简单来说就是内容生成方面，如生成图片，文字，视频，也包括RAG等。

4/1/2025 12:10:00 PM

DFires

速通BOSS需求！零基础AI Agent高效工作流设计指南

此次会连载一套 AI-Agent 构建的系列，主要分为三部分，首先是速通 AI-Agent 构建的工作流基础，然后是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台，最后则是借助 Agent 平台构建一个 AI Agent 案例，本系列意图主要是帮助大家贯通工作流的搭建形式，并尝试思考为自己的工作搭建一些可用的 AI 助手，或是提供构建的方法指引。无论你是产品经理还是设计师，你会发现商业场景的 AIGC，几乎都没有办法通过一段需求描述或是简单的 Agent 对话就搞定的，你需要更专业更复杂的 AIGC 过程，那么如何理解复杂？实现专业？

3/18/2025 8:22:14 AM

泡泡bing

RAG（三）GraphRAG进阶：GraphReader-- 基于图的Agent，让大模型“读懂”长文本

上一篇论文介绍了GraphRAG，今天来看一篇算是其进阶版的方法--GraphReader。对于其研究动机，简单来说，LLMs具有强大的规划和反思能力，但在解决复杂任务时，如函数调用或知识图谱问答（KGQA），以及面对需要多次推理步骤的问题时，仍然面临困难。特别是当涉及到长文本或多文档的处理时，现有的方法往往难以充分利用这些模型的能力来捕捉全局信息，并有效地进行决策。

3/13/2025 12:24:34 PM

Glodma

全网爆火的Manus到底能做什么？超多演示案例来了！

关注科技 AI 圈的同学，在 3 月 6 号这天都被 Manus 刷屏了，那么他是个啥呢？和 DeepSeek 和 Open AI 有什么区别呢？ Manus 官网上是这样说的“Manus 是一个通用的人工智能代理，它连接思想和行动：它不仅会思考，还会提供结果。

3/11/2025 12:54:46 AM

益达

阶跃星辰举办生态开放日，智能终端 Agent 成最大亮点！

2月21日，阶跃星辰在上海成功举办首届Step UP生态开放日，携手来自各行各业的重量级合作伙伴，集中展示了大模型技术赋能下的丰富应用场景与创新体验。阶跃星辰首先重点阐释了在智能终端Agent领域的布局，并宣布与吉利汽车集团、OPPO、智元机器人等企业深化合作关系。同时，还展示了在金融财经、内容创作、新零售、数字人等领域丰富的创新和应用。

2/21/2025 7:32:00 PM

新闻助手

OpenAI新研究：o1增加推理时间就能防攻击，网友：DeepSeek也受益

OpenAI的新Scaling Law，含金量又提高了。像o1这样的推理模型，随着思考时间的延长，面对对抗性攻击会变得更加稳健。图片随着大语言模型被越来越多地赋予Agent能力，执行现实世界的任务，模型被对抗攻击的风险也与日俱增。

1/23/2025 2:53:15 PM

OpenAI亮剑自主Agent？网友犀利点评：鸡肋，这不Siri干的活吗？反驳：不要低估这项新功能，接管人类的智能体AI已在路上

编辑 | 星璇圣诞节12场直播过后，OpenAI终于在2025开年亮剑了一款新功能！美东时间1月14日周二，OpenAI宣布推出名为Tasks的测试版新功能，从周二开始，三个不同版本ChatGPT——ChatGPT Plus、Team和Pro的订阅用户将可以试用这个新功能。 Tasks这个功能有什么本领？

1/15/2025 1:42:17 PM

星璇

抢先OpenAI“虚拟员工”！清华复旦斯坦福联手，让Agent接管电脑帮你工作

抢先OpenAI的“Operator”，清华、复旦、斯坦福等研究者联合起来整了个大活～他们提出了一个名为“Eko”的Agent开发框架，开发者只需用简洁的代码和自然语言，就能快速构建可用于生产的“虚拟员工”：Agent可以接管用户的电脑和浏览器，代替人类完成各种任务。而这个操作，正是之前OpenAI被爆出的“Operator”所能实现的。爆料称OpenAI将会这个月发布“Operator”，现在直接被截胡了。

1/14/2025 12:22:10 PM

【LLM&Agent】PPTAgent：PPT自动生成Agent框架

来看一个PPT生成思路：PPTAgent。传统的PPT生成方法通常使用端到端的文本生成范式，这种方法仅关注文本内容，忽略了布局设计和PPT结构。 PPTAgent 采用了一种基于编辑的生成范式，解决处理空间关系和设计风格方面的挑战。

1/8/2025 3:15:16 PM

余俊晖

OpenAI发布新年目标，Agent智能体或将迎来百模大战

2025年1月1日，OpenAI CEO 奥特曼公布了公司的新年目标，涵盖AGI、智能体、4o升级、模型更好记忆、更长上下文等等。图片关于智能体，有网友爆料，OpenAI 可能在 1 月份发布一个名为 “operator” 的 Agent，这个 Agent 将具备直接控制电脑的能力。图片其实24年10月份的时候，Claude 就已经发布了基于 Claude 3.5 Sonnet 多模态大模型，可操作电脑的智能体。

1/3/2025 11:02:38 AM

渡码

NeurIPS 2024 | LLM智能体真能模拟人类行为吗？答案有了

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年，AI在线AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。

12/11/2024 8:49:00 PM

机器之心

浅析面向场景的大模型应用框架选择

从demo到产品之间存在着鸿沟，大模型应用也是如此。在工程实践的时候，产品/服务提供的功能与性能及成本之间存在着大量的权衡，面向场景来选择大模型的应用框架，则是一种具体的权衡方法。例如，什么时候使用Agent？

12/9/2024 10:18:37 AM

曹洪伟

Scaling Law遭遇瓶颈，OpenAI被曝押注智能体“Operator”

继Anthropic之后，OpenAI也要接管人类电脑了？！就在刚刚，彭博社爆料OpenAI将在明年1月推出Agent“Operator（操作员）”，为用户自动执行任务。

11/14/2024 6:40:57 PM

把 AI 放进《我的世界》服务器：GPT-4o 杀牛宰羊，Claude3.5 把家拆了

把《我的世界》交给大模型，会怎么样？GPT-4o 鲨牛宰羊，Claude3.5 不停在人类身旁放炸药包和敌人，还把家拆了。GPT-4o mini 玩《我的世界》belike：来到游戏里面，GPT-4o mini（玩家 karolina）一开始还蛮礼貌的：你好世界！

10/21/2024 1:11:17 PM

清源

端到端优化所有能力，字节跳动提出强化学习LLM Agent框架AGILE

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；[email protected]

9/30/2024 2:14:00 PM

机器之心

新「AI科学家」？MIT整合多智能体，实现材料科学研究自动化

编辑 | 萝卜皮人工智能（AI）的一个关键挑战是：如何创建能够通过「探索新领域」、「识别复杂模式」和「揭示海量科学数据中隐藏的联系」来自主推进科学理解的系统。在最近的工作中，麻省理工学院（Massachusetts Institute of Technology）原子与分子力学实验室（LAMM）的研究人员提出了 SciAgents，一种可以整合利用三个核心概念的方法：（1）使用大规模本体知识图谱来组织和互连不同的科学概念；（2）一套大型语言模型（LLM）和数据检索工具；（3）具有现场学习能力的多智能体（agent）

9/27/2024 5:41:00 PM

ScienceAI

OpenAI 朝 AI 第 3 阶段迈进，正招募人才组建“多智能体”团队

OpenAI 在发布 o1 AI 模型之后，下一步会怎么走？该公司研究员诺姆・布朗（Noam Brown）在 X 平台给出了答案，组建“多智能体”multi-agent 研究团队。根据 OpenAI 公布五级量表，最新推出的 o1 模型处于第二阶段，即所谓的“推理者”（reasoners），而开发 multi-agent 符合第三阶段的目标要求。OpenAI 的五级量表如下：第一级：聊天机器人，具有会话语言的人工智能第二级：推理者，解决人类水平问题的人工智能第三级：智能体，能够代表用户采取行动的人工智能第四级：创新

9/21/2024 12:10:50 PM

故渊

独角兽也卷不动了：AI Agent初创Adept被爆考虑出售

机器之能报道编辑：Sia越来越多的生成AI公司考虑加入出售的行列。据 Theinformation 消息，近几个月，AI 独角兽 Adept 领导层与科技巨头公司就出售或战略合作可能性进行了谈判。Adept 是一家由前 OpenAI 和谷歌 AI 开发人员创立的 AI 公司，专注于 AI Agent ，成立仅两年。Adept 去年 3 月完成新一轮融资后，估值已超 10 亿美元。消息人士称，Adept 曾与 Meta 接触，尽管收购的可能性不大。越来越多的生成 AI 公司在考虑出售可能性。AI 硬件公司 Human

5/24/2024 6:49:00 PM

机器之能

资讯热榜

50组多风格提示词，全面测评Midjourney V7生图效果！斯坦福2025 AI指数出炉！中美AI对决差距仅剩0.3%，DeepSeek领衔 ChatGPT重大更新，能翻出所有历史对话，网友被AI聊破防了斯坦福 AI 指数报告发布：2024年美国 AI 私人投资约为中国的 12 倍、GPT3.5 级别模型推理成本下降 280 倍谷歌 Gemini AI 新功能 Circle Screen 曝光：圈选截屏特定区域，实现精准搜索 OpenAI 启动先锋计划，旨在重塑 AI 模型评分体系 OpenAI史上最硬核技术播客！系统揭秘GPT4.5诞生，已进入数据受限时代！小哥亲述大模型修bug血泪史；还有一个重磅开源消息 OpenAI 宣布 ChatGPT 自 4 月 30 日起停用 GPT-4 模型，全面升级至 4o 版本

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达神经网络腾讯计算研究 Sora AI for Science 3D AI设计 Anthropic 机器学习 GPU 开发者场景华为预测伟达 Transformer 百度深度学习苹果模态 AI视频驾驶文本 xAI 搜索人形机器人 Copilot 大语言模型神器推荐 LLaMA 字节跳动具身智能 Claude 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉 DeepMind 训练