如何看待”首个真干活”AI—Manus？

话题背景今日凌晨，一款通用AI Agent产品「Manus」正式发布。 GAIA评分已超越OpenAI的DeepResearch，成为GAIA评分第一。这一产品以“数字代理人”自居，宣称能独立完成复杂任务并交付完整成果，迅速成为科技圈的焦点。

话题背景

今日凌晨，一款通用AI Agent产品「Manus」正式发布。GAIA评分已超越OpenAI的DeepResearch，成为GAIA评分第一。这一产品以“数字代理人”自居，宣称能独立完成复杂任务并交付完整成果，迅速成为科技圈的焦点。与 Manus 同步出圈的还有一段长达四分钟的演示 demo。在这些案例中，Manus完全自主地完成从规划到执行的全流程，展示了真正的Agent能力，而非简单的助手功能。

那么，当AI不仅拥有强大的思考能力，还具备高效的执行力时，将会带来怎样的变革？关于Manus，你怎么看？

鹅厂工程师的看法

@arsene-应用研究员

如何看待”首个真干活”AI—Manus？

看了官网的案例，manus会把任务拆解，放在一个 todo.md 里，每做完一步就勾掉一个。这种用外置文件来实现“工作记忆”的方式很有趣。

如何看待”首个真干活”AI—Manus？

@vin-数据分析师

如何看待”首个真干活”AI—Manus？

产品的设计思路是非常不错的，不过缺乏很多细节推证，没有邀请码无法复现具体细节。

对任务拆解的复杂性还是显得非常低级。另外，关于执行任务中的资源也是一个不小的开销，启动资源时，是否合理评估资源大小，按任务的复杂度来分配资源大小也没有，合理的是加上这方面的思考过程。总的来说：任务拆解+资源分配+效果评估+结果输出。才是这类型产品更合理的方向。

@keyi-行业应用

如何看待”首个真干活”AI—Manus？

看了界面的所有case感觉想象力可以完全打开，但是苦于没有邀请码，先申请试用等待ing。

对比年前的cua，先一波“炸裂”给到monica团队

如何看待”首个真干活”AI—Manus？

@匿名

如何看待”首个真干活”AI—Manus？

说了什么不重要，做了什么做成了什么更重要！用户并不在乎底层用了什么，如何调用各种工具，关键是在体验上，是不是能做到完整融合，这方面至少看起来 Manus 做的还不错。

这波AI 产品的发展有几个特点：

产品的开发团队，可能是大厂，可能是金融企业，可能是小作坊，背景越来越不重要；
说得再漂亮，都没用，就要看用户体验。是骡子是马，都要拿出来溜溜；
大模型厂商继续在 AGI 的道路上迈进，留下了给应用型企业的窗口期，而应用型产品的设计，需要新型的“AI 产品经理”（AIPM），既对市场上 SOTA （最为先进）的 AI 模型、工具有足够的了解（特别是国外的最新产品，主要观察窗口就是 Producthunt，Manus 其实有点类似于 Deep Research），又对人性、用户体验、使用习惯等有互联网产品的认知；
这给很多to B to A的企业（比如我们腾讯云）带来了机会，而参考上面的趋势，AI 好不好，光方案没用，还是要“溜”，这需要“陪跑”。但是这样的“陪跑”，对于to B to A企业的要求很高，既需要具备传统的客户教育、咨询能力，又要有扎实的整合、交付和运维能力。这种新型的 AI落地咨询、陪跑服务，是市场目前需要的。

如何看待”首个真干活”AI—Manus？

@yark-客户端开发

如何看待”首个真干活”AI—Manus？

看demo和Devin有点类似，训练一个planner来生成plan，调用其他LLM做执行。感觉这种能力 Devin、Cursor 做的已经比较成熟了，他们基于 Claude 的模型一次性能调用很多的 Tool，不过主要场景是写代码和文件编辑。这次 Manus 的营销点应该是通过加上了 computer use 和虚拟机的能力，把能力扩展到了更多日常办公的场景，所以比较出圈。

如何看待”首个真干活”AI—Manus？

@vikyfj-应用开

如何看待”首个真干活”AI—Manus？

给AI加上眼睛（视觉）和手（至少会控制键盘鼠标），能用上目前面向人的各种工具，就7788了。

@grey-前端开发

如何看待”首个真干活”AI—Manus？

看了下几个博主的评测视频，确实非常牛。。。无论是报表生成、游戏开发等等从思考过程到最终的产出质量都很高，目测又是一个现象级的AI新形态产品。

Manus本质上有点像一个套壳工具，将大模型作为中央处理器，支持各种多模态数据的输入输出，并通过智能体工具实现跨应用操作，有种集百家之长的感觉🤣这种设计让Manus能够自主完成各种复杂任务。

但个人觉得Manus最突出的亮点还是具备强大的工具调用能力，能够自主调用浏览器、代码编辑器、数据分析工具等，直接交付任务成果。比如他可以根据你的一份简单的游戏设计思路，自己从整个游戏玩法设计出发逐渐完善，然后再自行调用各种工具如绘图工具、代码编辑器等等完成开发，全程无需手动介入，真正意义上的从任务拆解到成果交付全程自主执行。

很期待后续各家大厂的跟进措施。

如何看待”首个真干活”AI—Manus？

@lawrence-应用开发

如何看待”首个真干活”AI—Manus？

现在就等团队说的会开源的做过 post training 的模型包含会拆解任务的那个模型了，然后开始“微创新”

@ericj-刑事法律

如何看待”首个真干活”AI—Manus？

朋友有拿到邀请码，应该体验最好的operator了，太炸裂。

@groot-后台开发

如何看待”首个真干活”AI—Manus？

本条由 Manus 使用 deepseek r1 作答：

关于「Manus」的技术实现、工具调用和工程调优方面，以下是一些可能的看法：

技术实现：Manus作为一款通用AI Agent，可能依赖于先进的算法与模型，例如深度学习和自然语言处理。它的能力在于协调思维与行动，这意味着在理解任务的基础上，它可以执行复杂的操作。这种结合可以使得AI在多个领域内更高效地工作，例如在医疗、金融或制造业等。
工具调用：Manus可能集成了多种API和工具，可以在不同的应用场景下调用相应的资源。这使得它能够处理各种数据输入并优化决策过程，例如通过实时数据分析来改进工作流程。
工程调优：为了使Manus能够高效稳定地运行，工程调优是至关重要的。这可能涉及到持续的模型训练、参数调整和算法优化，以改善其性能和响应时间。此外，通过用户反馈和使用数据的学习，Manus也可以不断自我提升。

如何看待”首个真干活”AI—Manus？

如何看待”首个真干活”AI—Manus？

话题背景

鹅厂工程师的看法

@arsene-应用研究员

@vin-数据分析师

@keyi-行业应用

@匿名

@yark-客户端开发

@vikyfj-应用开

@grey-前端开发

@lawrence-应用开发

@ericj-刑事法律

@groot-后台开发

相关资讯

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

腾讯云上线DeepSeek全系API接口并打通联网搜索

微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息

如何看待”首个真干活”AI—Manus？

话题背景

鹅厂工程师的看法

@arsene-应用研究员

@vin-数据分析师

@keyi-行业应用

@匿名

@yark-客户端开发

@vikyfj-应用开

@grey-前端开发

@lawrence-应用开发

@ericj-刑事法律

@groot-后台开发

相关资讯

DeepSeek-R1 登顶 Hugging Face：以10000 赞力压 150 万个模型

腾讯云上线DeepSeek全系API接口并打通联网搜索

微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息

微信搜索接入DeepSeek大模型称AI不会使用朋友圈聊天等信息