企业智能体:为AI投资带来丰厚回报

基于AI的智能体当下可谓风头正劲。 最近几个月来,这个话题也已渗透到不少技术供应商的宣传和营销当中,包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。 从多方面来讲,人们对AI智能体的关注有其道理:智能体代表着生成式AI的下一个发展阶段,有望进一步提高AI的自主性水平。

企业智能体:为AI投资带来丰厚回报

基于AI的智能体当下可谓风头正劲。最近几个月来,这个话题也已渗透到不少技术供应商的宣传和营销当中,包括Salesforce、Microsoft、ServiceNow、SAP、亚马逊云科技以及谷歌。从多方面来讲,人们对AI智能体的关注有其道理:智能体代表着生成式AI的下一个发展阶段,有望进一步提高AI的自主性水平。智能体不仅可以像聊天机器人那样回答问题,还能接受人类甚至是其他智能体委托给它们的任务。而且与AI领域的其他成果一样,智能体同样保持着迅猛的发展速度。

短短两个月前,关于智能体的新闻和产品公告还主要集中在应用程序内等传统场景之下。这类智能体的作用是在平台环境下实现个体的生产力与任务自动化。例如,可以设计一个定期扫描多份文档、总结其中信息并向最终用户推荐相应操作的个人生产力代理。以Salesforce为例,这可能意味着其产品会每季度扫描潜在客户渠道,观察是否存在新的数字营销机会并提供策略建议。这些个人生产力智能体将为希望快速完成更多工作的最终用户带来巨大助益。

个人生产力智能体的局限性

虽然个人生产力智能体作用不小,但影响力或者说想象空间却相当有限。首先需要承认,这些部署在应用平台内的个人生产力智能体其实很强,能够提升现有技术投资来展示智能体的整体潜力,而且会随着时间推移而加深用户与平台之间的联系。然而,真正的业务影响力应当让企业看到明确的投资回报并为此加大资源投入,而不只是带来种种“锦上添花”的效果。遗憾的是,我认为个人生产力智能体无法达到这样的地位,具体原因有三。

遗憾团队使用往往反而影响业务开展——当一名员工找到更高效的工作方式时,那确实不错,但却远不足以带动其他团队成员乃至整个职能架构来改进工作流程。换句话说,一、两个开发人员编程速度加快是好的,但这不太可能推动应用程序的提前发布。

个人生产力的提升不会增加高级用户或者超级用户的数量——虽然AI拥有巨大潜力,但我们观察到个人生产力应用的技术突破似乎迟迟没有来临。几十年下来,人人的电脑里都装上了电子表格软件,而虽然这些软件也一直在不断进步,但高级用户在总体用户中的比例是否发生了变化?答案似乎是否定的。当然,也没有明确的办法来定义高级用户并量化他们的影响力。

面向个人的工具难以由IT部门统一管理和掌控——多年以来,许多工具都实现了个人生产力的提升。低代码和无代码工具供应商们一直宣扬让人们自主开发工具来实现自我赋能。虽然确有典型案例表明这种方式对个别人有效,但这些工具也给IT部门造成了不小的麻烦。应用程序蔓延就是种明确趋势,许多人都在独自创建功能大体相同的应用程序。随着时间推移,其中大部分工具自然就被遗忘掉甚至从未被真正使用。这些平台产生的成本、治理和安全问题对于资金本就紧张的IT团队来说,无疑构成了严峻挑战。

真正有影响力的智能体应当以企业为中心

同样的,个人生产力智能体虽也具有实用性,但生成式AI的生态系统仍需要提供更可量化的商业价值来证明战略投资的合理性。最近一段时间,已经出现了相关的积极势头。UiPath就通过开发企业智能体来匹配其机器人流程自动化解决方案,从而实现更为高效的业务流程。通过采用不同的治理和智能体开发方法,UiPath在构建跨企业智能体应用方面获得了更大的施展空间。

再来看其他案例。IBM等咨询公司也在重新调整其交付企业系统集成项目的方式,运用自己的企业内智能体开发体系来缩短交付周期并提高项目质量。在研究这些公司及其他致力于企业AI智能体厂商时,我们发现尽管具体技术形式不同,但其实施仍然依赖于过去40年发展而成的完善IT实践。其中的核心原则包括:

从有意义的跨职能业务问题起步——就是说项目应当至少拥有一项受到影响的业务指标,例如部署的技术应在不增加销售人员数量的前提下增加收入。

高度重视变更管理——虽然难以对高级用户在总体用户中的比例做出精准量化,但大多数IT负责人表示,只有不足20%的用户属于高级使用者。因此,引入任何技术进步都必须要能渗透至普通用户、或者配合充分的变更管理才能得到广泛应用。例如,凭借大语言模型提供的核心功能,智能体成功以在线咨询的形式为普通用户带来帮助,并由此得到了迅速普及。

建立坚实的技术基础——取得成功的一大前提,在于建立起坚实的技术基础。智能体应用涉及大量不同数据,因此必须确保数据得到妥善保护。随着时间推移,以可靠的计算与存储形式存在的基础设施也非常重要,这将决定应用程序能否被扩展至整个企业范围。

以深思熟虑的方式设计应用框架——要确保项目稳步推进,我们需要一整套明确的目标框架来衡量整个项目生命周期。这些目标和量化标准应当来自内部开发或者由信誉良好的第三方提供的应用框架。除了IBM Consulting Advantage等解决方案之外,Zavvis等初创公司也在尝试将常见的职能角色(例如CFO)归入自动化框架。

注意培养用户粘性,并确保多年可用——一时兴起建立的项目纯粹是心理安慰。不要单纯着眼于解决当下的问题,而应当在设计解决方案时确保其成为新的运营流程,能够切实提供价值并防止项目废弃引发的风险。

AI投资回报=企业智能体+成熟IT实践

再闪重申,我并不是要贬低当前这波个人生产力智能体。它们确实效果不错,而且老实说,它们也是让决策者们适应和了解AI的合理形式。然而,当领导团队决定押注新技术时,我认为门槛还应该再高一些。

好消息是,如今越来越多的云服务商、企业和初创技术供应商都在为此积极努力,此类新型AI智能体也在各种实践场景下得到应用和发挥。总之,面对大好的形势,请各位戒骄戒躁、保持谨慎,毕竟以往因盲目冒进而折戟沉沙的企业级技术已然难计其数。

相关资讯

清华、小米、华为、 vivo、理想等多机构联合综述,首提个人LLM智能体、划分5级智能水平

嘿 Siri、你好小娜、小爱同学、小艺小艺、OK Google、小布小布……想必这些唤醒词中至少有一个曾被你的嘴发出并成功呼唤出了一个能给你导航、讲笑话、添加日程、设置闹钟、拨打电话的智能个人助理(IPA)。可以说 IPA 已经成了现代智能手机不可或缺的标配,近期的一篇综述论文更是认为「个人 LLM 智能体会成为 AI 时代个人计算的主要软件范式」。这篇个人 LLM 智能体综述论文来自国内多所高校和企业研究所,包括清华大学、小米、华为、欢太、vivo、云米、理想汽车、北京邮电大学、苏州大学。文中不仅梳理了个人 LL

吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

下一步是智能体?随着 ChatGPT、GPT-4、Sora 的陆续问世,人工智能的发展趋势引起了广泛关注,特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问:人工智能领域下一个突破方向将会是什么?今天,人工智能著名学者、斯坦福大学教授吴恩达指出:AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。他呼吁所有从事人工智能工作的人都关注 AI 智能体工作流,并撰写一篇博客简单阐述了原因。我们对博客内容进行了不改变原意的编译、整理,以下是博客内容:当前,我们主要在零样

吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果

智能体的潜力被低估了?AI 智能体是去年很火的一个话题,但是 AI 智能体到底有多大的潜力,很多人可能没有概念。最近,斯坦福大学教授吴恩达在演讲中提到,他们发现,基于 GPT-3.5 构建的智能体工作流在应用中表现比 GPT-4 要好。当然,基于 GPT-4 构建的智能体工作流效果更好。由此看来,AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。这是一个值得所有人关注的趋势。这个关于智能体的演讲在社交媒体上引发了广泛关注。有人表示,这代表着 AI 发展中的范式转变,体现了从静态输出到动