如何看待”首个真干活”AI—Manus?

话题背景今日凌晨,一款通用AI Agent产品「Manus」正式发布。 GAIA评分已超越OpenAI的DeepResearch,成为GAIA评分第一。 这一产品以“数字代理人”自居,宣称能独立完成复杂任务并交付完整成果,迅速成为科技圈的焦点。

话题背景

今日凌晨,一款通用AI Agent产品「Manus」正式发布。GAIA评分已超越OpenAI的DeepResearch,成为GAIA评分第一。这一产品以“数字代理人”自居,宣称能独立完成复杂任务并交付完整成果,迅速成为科技圈的焦点。与 Manus 同步出圈的还有一段长达四分钟的演示 demo。在这些案例中,Manus完全自主地完成从规划到执行的全流程,展示了真正的Agent能力,而非简单的助手功能。

那么,当AI不仅拥有强大的思考能力,还具备高效的执行力时,将会带来怎样的变革?关于Manus,你怎么看?

如何看待”首个真干活”AI—Manus?

鹅厂工程师的看法

@arsene-应用研究员

如何看待”首个真干活”AI—Manus?

看了官网的案例,manus会把任务拆解,放在一个 todo.md 里,每做完一步就勾掉一个。这种用外置文件来实现“工作记忆”的方式很有趣。

如何看待”首个真干活”AI—Manus?

@vin-数据分析师

如何看待”首个真干活”AI—Manus?

产品的设计思路是非常不错的,不过缺乏很多细节推证,没有邀请码无法复现具体细节。

对任务拆解的复杂性还是显得非常低级。另外,关于执行任务中的资源也是一个不小的开销,启动资源时,是否合理评估资源大小,按任务的复杂度来分配资源大小也没有,合理的是加上这方面的思考过程。总的来说:任务拆解+资源分配+效果评估+结果输出。才是这类型产品更合理的方向。

@keyi-行业应用

如何看待”首个真干活”AI—Manus?

看了界面的所有case感觉想象力可以完全打开,但是苦于没有邀请码,先申请试用等待ing。

对比年前的cua,先一波“炸裂”给到monica团队

如何看待”首个真干活”AI—Manus?

@匿名

如何看待”首个真干活”AI—Manus?

说了什么不重要,做了什么做成了什么更重要!用户并不在乎底层用了什么,如何调用各种工具,关键是在体验上,是不是能做到完整融合,这方面至少看起来 Manus 做的还不错。

这波AI 产品的发展有几个特点:

  • 产品的开发团队,可能是大厂,可能是金融企业,可能是小作坊,背景越来越不重要;
  • 说得再漂亮,都没用,就要看用户体验。是骡子是马,都要拿出来溜溜;
  • 大模型厂商继续在 AGI 的道路上迈进,留下了给应用型企业的窗口期,而应用型产品的设计,需要新型的“AI 产品经理”(AIPM),既对市场上 SOTA (最为先进)的 AI 模型、工具有足够的了解(特别是国外的最新产品,主要观察窗口就是 Producthunt,Manus 其实有点类似于 Deep Research),又对人性、用户体验、使用习惯等有互联网产品的认知;
  • 这给很多to B to A的企业(比如我们腾讯云)带来了机会,而参考上面的趋势,AI 好不好,光方案没用,还是要“溜”,这需要“陪跑”。但是这样的“陪跑”,对于to B to A企业的要求很高,既需要具备传统的客户教育、咨询能力,又要有扎实的整合、交付和运维能力。这种新型的 AI落地咨询、陪跑服务,是市场目前需要的。

如何看待”首个真干活”AI—Manus?

@yark-客户端开发

如何看待”首个真干活”AI—Manus?

看demo和Devin有点类似,训练一个planner来生成plan,调用其他LLM做执行。感觉这种能力 Devin、Cursor 做的已经比较成熟了, 他们基于 Claude 的模型一次性能调用很多的 Tool,不过主要场景是写代码和文件编辑。 这次 Manus 的营销点应该是通过 加上了 computer use 和 虚拟机的能力,把能力扩展到了更多日常办公的场景,所以比较出圈。

如何看待”首个真干活”AI—Manus?

@vikyfj-应用开

如何看待”首个真干活”AI—Manus?

给AI加上眼睛(视觉)和手(至少会控制键盘鼠标),能用上目前面向人的各种工具,就7788了。

@grey-前端开发

如何看待”首个真干活”AI—Manus?

看了下几个博主的评测视频,确实非常牛。。。无论是报表生成、游戏开发等等从思考过程到最终的产出质量都很高,目测又是一个现象级的AI新形态产品。

Manus本质上有点像一个套壳工具,将大模型作为中央处理器,支持各种多模态数据的输入输出,并通过智能体工具实现跨应用操作,有种集百家之长的感觉🤣这种设计让Manus能够自主完成各种复杂任务。

但个人觉得Manus最突出的亮点还是具备强大的工具调用能力,能够自主调用浏览器、代码编辑器、数据分析工具等,直接交付任务成果。比如他可以根据你的一份简单的游戏设计思路,自己从整个游戏玩法设计出发逐渐完善,然后再自行调用各种工具如绘图工具、代码编辑器等等完成开发,全程无需手动介入,真正意义上的从任务拆解到成果交付全程自主执行。

很期待后续各家大厂的跟进措施。

如何看待”首个真干活”AI—Manus?

@lawrence-应用开发

如何看待”首个真干活”AI—Manus?

现在就等团队说的会开源的做过 post training 的模型包含会拆解任务的那个模型了,然后开始“微创新”

@ericj-刑事法律

如何看待”首个真干活”AI—Manus?

朋友有拿到邀请码,应该体验最好的operator了,太炸裂。

@groot-后台开发

如何看待”首个真干活”AI—Manus?

本条由 Manus 使用 deepseek r1 作答:

关于「Manus」的技术实现、工具调用和工程调优方面,以下是一些可能的看法:

  • 技术实现:Manus作为一款通用AI Agent,可能依赖于先进的算法与模型,例如深度学习和自然语言处理。它的能力在于协调思维与行动,这意味着在理解任务的基础上,它可以执行复杂的操作。这种结合可以使得AI在多个领域内更高效地工作,例如在医疗、金融或制造业等。
  • 工具调用:Manus可能集成了多种API和工具,可以在不同的应用场景下调用相应的资源。这使得它能够处理各种数据输入并优化决策过程,例如通过实时数据分析来改进工作流程。
  • 工程调优:为了使Manus能够高效稳定地运行,工程调优是至关重要的。这可能涉及到持续的模型训练、参数调整和算法优化,以改善其性能和响应时间。此外,通过用户反馈和使用数据的学习,Manus也可以不断自我提升。

如何看待”首个真干活”AI—Manus?

相关资讯

爆火的 Manus,到底啥来头?对 AI 影响有多大?

AI 圈最近又出了个超级大新闻! 有一款叫 Manus 的产品,就像一颗炸弹,瞬间在全球引发了关注热潮。 今天咱就来唠唠,这 Manus 到底是何方神圣,又会给 AI 领域带来哪些变化。

Manus是智能体的"DeepSeek时刻"?DeepSeek本尊怎么看?

Manus从一夜爆火到一码难求,市场开始出现不同的声音。 支持者认为,Manus是智能体的"DeepSeek时刻";反对者认为,Manus是一场精心策划的“炒作”。 Manus成色究竟如何,不妨来听听作为对标对象的DeepSeek的回答。

中国智造“Manus”横空出世:邀请码炒到10W?半天就翻车了?

今日科技圈上演 "抢码大战",Manus 内测邀请函引发全民抢购热潮。 据不完全统计,二手交易平台已有超 200 个卖家挂售邀请码,报价从 5.8 万元至 10 万元不等,部分稀缺时段码源溢价率高达 300%。 有科技博主戏称:"现在邀请码的含金量,堪比当年比特币矿机预售资格。