如果说今年的风口,那一定是 AI。不过 AI 像一把双刃剑,既有助益也有风险。我们将从 IBM Watson 的高飞与坠落,到 Google Allo 的黯然失色,探索 AI 应用中的教训。同时,瑞幸咖啡的成功故事展现了凭借策略得当的 AI 应用,即使在困境中也能崛起。通过 ChatGPT 实践案例,我们进一步揭示 AI 在日常工作中的潜能,从 PRD 文档编写到内容管理的自动化。最后,我们讨论如何与 AI 高效交流,确保 AI 是成为推动进步的力量而非阻碍。在整篇文章中,我将分享 AI 的正确应用价值,和如何嵌入实际的应用场景中。
一、聚焦 AI 产品,浅谈应用价值
在分析 AI 的应用场景之前,我们先将目光锁定一下目前前沿的 AI 产品如 ChatGPT 4、Stable Diffusion(SD)、Midjourney(MJ)、DALL·E。让我们看看它们是如何成为当前技术革新的代表的。
ChatGPT 尤其引人注目,它基于 OpenAI 的 GPT-4 模型,提供了与人类相似的交互体验。我个人在使用 ChatGPT 时,由于其高级功能需要订阅,我采取了特定的步骤来续费,包括创建美区账号并通过充值卡支付,这个过程确实有些繁琐,一开始也将我劝退。我也尝试过去使用其他的 AI 产品,例如 Gemini、火山写作、百度的 ERNIE 等,对于这些产品,一个共通的缺点是在特定领域或任务上的局限性。尽管它们可能在特定场景下表现出色,但无一例外,它们都存在某些方面的不足,如理解复杂查询的能力、跨语言应用的适应性、创意内容生成的深度和宽度,以及对特定用户群体的可访问性和成本效益。其实我个人觉得 Gemini 还挺不错的,响应速度比 chat GPT4 要快。不过我从一开始就用的是 GPT3.5,到目前也在坚持续费 GPT4,也算是 GPT4 的忠实使用者。
在 AI 视觉创作领域,DALL·E、Midjourney(MJ)、和 Stable Diffusion(SD)各自展现了独特的风格和功能。由 OpenAI 开发的图像生成 AI-DALL·E,更擅长根据用户的文本描述生成插画风格和仿 3D 的图像。它对于抽象概念的理解能力强,能创造出富有创意的视觉作品。尽管 DALL·E 在创意表达上表现卓越,但在生成真实感图像方面,尤其是复杂场景和细节处理(如人物面部和手部)上,仍有局限。其生成的图片往往带有明显的 AI 生成特征,缺乏一定的真实感。
Midjourney 与其他 AI 生图工具,例如 Leonardo.ai 使用的 Stable Diffusion 及其衍生版本,在技术基础上有显著的区别。Midjourney 利用的是自主研发的闭源模型,这种独特的技术选择为其带来了更细腻的参数调整能力和卓越的艺术表现力,这也正是最初吸引了众多用户的原因。网络资料显示,Midjourney 的模型训练参数高达 300-400 亿,相较之下,最新版的 Stable Diffusion 参数仅有 66 亿。Midjourney 的图像因其出众的视觉效果而受到称赞,但这种优势伴随着较大的不确定性,一些用户比喻其体验类似于随机抽取,尽管每张图像都具有视觉冲击力,但常常在细节上未能完全达到用户的期望。这种较高的不确定性导致了使用 Midjourney 的成本增加,这里的成本不仅仅指金钱,更多指的是时间成本。由于不确定性的存在,用户在寻求一张满意图片的过程中需要投入更多的时间,并且必须不断学习和调整 Prompt 命令来控制图像生成效果。如果用户不愿意投入大量时间进行学习,那么使用 Midjourney 可能不会比使用其他工具获得更好的结果。
反观 Stable Diffusion,作为一个开源模型,其设计初衷便是拥有出色的可扩展性,允许开发者根据自己的应用场景进行定制。虽然在起初,由于训练数据量有限,基于 Stable Diffusion 开发的模型在图像生成效果上通常不及 Midjourney,但随着时间的推移,开源模型的可控性和扩展性的优势开始显现。这种开放性赋予了 Stable Diffusion 长期的发展前景,使其成为一个能够不断适应新挑战和需求的强大平台。
可在实际工作环境中,尽管 Midjourney 以其卓越的艺术表现力和细腻的图像质量受到了高度赞誉,但是在公司的实际应用过程中,Stable Diffusion(SD)却因其灵活性和开放性成为了更受青睐的选择。这一现象反映了在商业和技术决策中,可扩展性和自定义能力往往比单一的视觉效果更为重要。Stable Diffusion 的开源特性允许公司根据特定的业务需求进行定制化开发,这种高度的适应性使其能够被广泛应用于不同的项目和任务中。无论是为营销材料生成引人注目的视觉内容,还是为产品设计提供创意灵感,SD 都展现出了其强大的功能性和实用性。更重要的是,随着社区的共同努力和持续的技术迭代,基于 SD 的应用和工具正在快速进步,为企业提供了丰富的资源和灵活的解决方案。
SD 的本地部署能力为企业提供了数据处理的安全性和私密性,这对于处理敏感信息或遵守特定数据保护法规的公司尤为重要。尽管这也带来了一定的部署复杂度和学习成本,但对于追求高度定制和控制的企业来说,这些投入是值得的。随着时间的推移,SD 社区也在不断简化部署流程和降低使用门槛,使得更多公司能够轻松利用这一强大的技术。
二、AI 应用场景解码
尽管许多公司对 AI 充满期待,但如何将 AI 技术有效集成到现有的工作流程中?还是很迷茫的。这就像是知道目的地,却找不到合适的路一样让人挠头。在当前的商业环境下,诸多公司对于 AI 的态度可以概括为“知其好而不知其用”。这反映出一个广泛的现象:尽管 AI 的潜力被普遍认识到,但如何将其有效集成到具体的工作流程中仍然是一个挑战。前段时间我的一个师兄还在跟我说,他们公司业务对 AI 还是不知道怎么去用,都知道好就是没有应用场景,整个公司都很懵逼的状态。有点类似于知道变身成凹凸曼很厉害,但是让我来,我不知道怎么放技能。
多数公司的现状
所以刚开始很多公司在对于 AI 的应用策略上都是“摸着石头过河”,并不是所有尝试都取得了成功。IBM Watson 在医疗领域的挑战、Google Allo 的失败、Amazon Rekognition 的争议、以及 Microsoft Tay 的公关灾难这些事件都是 AI 商业应用中值得关注的案例,从中也能吸取很多重要教训。我们就拿 IBM Watson 这个产品分析下它的商业应用价值和最终策略失败的真正原因:
1. IBM Watson 在医疗领域的挑战
IBM Watson 在医疗领域的尝试是人工智能技术商业应用的一个重要案例。Watson Health 的目标是通过利用大数据和机器学习来改善医疗服务的质量和效率,尤其是在疾病诊断和个性化治疗方案的制定上。
个性化医疗:Watson Health 旨在通过分析患者的医疗记录和最新的医学研究,为每个患者提供个性化的治疗方案。这种方法有潜力大幅提高治疗效果,尤其是对于癌症等复杂疾病。 效率提升:通过自动化分析医学文献和病例数据,Watson 可以帮助医生和研究人员节省大量的时间,加快诊断和治疗决策过程。 决策支持:Watson 提供的数据驱动决策支持有助于降低医疗过程中的错误,提升病人治疗的准确性和安全性。然而,尽管初衷良好,Watson Health 在商业化过程中遇到了诸多挑战,最终未能实现预期的商业价值。医疗数据的复杂性和不一致性对 Watson 提出了巨大挑战。非结构化的医疗记录、不同医疗机构的数据格式不统一以及隐私保护要求,都增加了数据整合和分析的难度。且 Watson Health 在技术上具有创新性,但其商业模式未能有效解决医疗行业的需求,包括如何融入现有的医疗流程中、医生和患者对 AI 技术的信任度不足,以及高昂的成本问题。
所以可以总结一下就是 IBM Watson 在医疗领域的失败主要源于数据处理的困难以及其商业模式和市场接受度未能达到预期。IBM Watson 在医疗领域的挑战,从一个更宽广的视角看,可以归咎于对 AI 商业应用场景寻找的不是最佳的选择。Watson 尝试解决的问题超出了当前 AI 技术能力的最佳应用范围,或者说,这个特定的应用场景并不是 AI 技术发挥最大价值的地方。
三、瑞幸借助 AI 华丽逆袭
而 AI 真的没有好的应用场景吗,或者说 AI 只是可远观而不可用的能力?不。相信大家还记得之前瑞幸咖啡的“财务造假”的新闻吧,回看 2020 年的 6 月份,瑞幸因为财务造假被强行退市,截止到了 2021 年的 8 月居然开始实现盈利,短短一年的时间从起死回生到全行业第一,他中间到底做了什么?2023 年他它的销售额超越星巴克、门店数量超过 16,000 家的壮观成绩,背后反映的其实是企业通过技术创新,尤其是 AI 的深度应用,实现的快速转型和增长。
即使今天瑞幸的管理层全部放假,他全国所有的门店依旧都可以照常经营的,丝毫不会受到影响。你觉得我说的太夸张?我们可以分析一下瑞幸的成功归结于哪几个关键策略和技术应用:
全价值链的自动化和智能化:从产品研发迭代、供应链管理、门店选址、组织监管到个性化营销和顾客服务,瑞幸通过构建一整套定制化的 AI 系统,实现了业务流程的自动化和智能化,极大地提升了效率和客户满意度。 个性化营销的深化应用:利用 AI 分析用户行为和偏好,瑞幸能够提供高度个性化的推广活动和产品推荐,提高了销售转化率和顾客忠诚度。 智能监管和预测系统:AI 不仅用于顾客端的个性化推荐,还深入到门店运营管理中。通过实时监控订单流量、预测销量,AI 帮助门店优化库存管理和员工效率,甚至在无需人工干预的情况下自动调整产品供应链。 迭代速度和新品开发:瑞幸的新品开发速度非常快,这得益于其 AI 系统能够快速分析市场反馈和销售数据,加速产品迭代周期,及时推出符合市场需求的新产品。 数据驱动的决策制定:在瑞幸,几乎所有的商业决策都是基于数据和 AI 分析结果来进行的,无论是市场营销策略、产品开发还是供应链优化,都以数据为基础,确保了决策的准确性和有效性。瑞幸的故事也为其他企业提供了重要的启示:在大数据和 AI 技术不断进步的今天,企业可以通过技术创新,特别是智能化的应用,来实现业务的快速增长和市场竞争力的提升。同时,这也表明了未来商业竞争的一个重要趋势:应用先进的 AI 技术和数据分析能力将成为企业获得核心竞争力的关键。
四、实践案例 chat GPT 的应用场景
尽管 AI 技术在企业中的应用案例众多,有时我们仍然会发现自己对如何将 AI 融入日常工作以提高效率感到困惑。在众多 AI 产品中,OpenAI 的 ChatGPT 无疑是最具潜力的工具之一。然而,如果我们仅将其视为一个高级搜索引擎,那么就大大低估了它的能力。
在探索 AI 如何优化工作流程的过程中,我开发了两个定制化的 ChatGPT 应用:一是 PRD 撰写助手,它能根据提供的项目信息自动生成产品需求文档,极大简化了文档编写工作;二是智能素材库管理助手,这个工具可以自动为上传的素材判断业务领域、类型,进行自动打标签和命名,有效提高了素材管理的效率。这两个案例展示了通过 AI 定制化开发,将 ChatGPT 嵌入到工作流程中,关键在于我们如何定义任务和提出问题。一旦我们掌握了这些技巧,ChatGPT 便能成为提升工作效率的强大助力。我们能够针对具体的工作痛点设计解决方案,从而在各自的领域内实现工作效率的显著提升。
1. 开胃小菜:需求文档 GPT 助手
这天领导突然让我产出一份 PRD 文档,11 点开会评审的时候要用,当时已经是 10 点了。一个小时如何快速产出一份完善的 PRD 文档?这个时候 GPT 就派上用场了。但是项目背景、项目核心功能、产品目标什么的你一个一个地去和 GPT 聊,首先先不说它能不能形成连贯性思维,它可能会把你的问题逐个分析处理,但是不会数据留档,其次它所生成的内容会说的很空很概念化,会具备一定的参考价值,但是还需要你结合项目情况进行二次调整。有这个时间不如去小红书上找几个模板自己套一下。
Chat GPT 4 有一个很核心的功能就是自定义 chat gpt,你可以创建属于你的专属 GPT。你甚至可以通过大白话的形式和它交流,它会根据你的要求更新指令(prompt),并部署 GPT。但是这个要求指令需要步步引导,且等待它理解你的意思并优化成相对规范的 prompt 也是非常耗时间的。我们要学会利用格式规范,以 ai 可以快速理解的格式与之交流,不仅可以快速部署,且规范化指令会让 GPT 的输出更加稳定。
所以在我部署 GPT 之前,我会对 prompt 进行三大要素的梳理:
规范性
专业性语言:通过整个描述,采用了专业术语,如“PRD 文档框架-润色”、“专家级 ChatGPT 提示工程师”等,确保了沟通的专业性。
角色设定:明确了与用户互动的角色(专家级 ChatGPT 提示工程师)和用户的称呼(张老师),规范了双方的互动模式。
行动指引:对于每一步骤,给出了明确的动作指引,如“询问是否继续执行”、“确认活动中的专家角色”等,为用户提供了清晰的指导。
格式化
编号列表:采用了编号列表的格式,将整个流程分为 17 个步骤,每个步骤都有明确的编号,便于阅读和理解。
步骤清晰:每一步的任务都被清楚地分解和描述,格式一致,每个步骤都独立成段,易于跟踪和执行。
逻辑性
逻辑顺序:从用户的需求出发,到角色的确认,再到具体的执行步骤,最后是反馈和调整,整个过程呈现出明确的逻辑顺序。
条件逻辑:在一些步骤中嵌入了条件逻辑,比如如果用户同意或不同意,会有不同的后续行动,这样的设计提高了互动的灵活性和适应性。
反馈循环:在流程的最后阶段,通过询问用户的满意度和是否需要更改,形成了一个反馈循环,确保能够根据用户反馈进行调整,以达到用户的期望。
完整的 PRD 文档助手 prompt
简单的描述项目背景后限定角色
直截了当的提出需求
GPT 会提出一系列关键点问题
“有条理性的回复 GPT 的问题”后直接产出 PRD 文档
2. Chat GPT 接入项目场景
ok,这只是 AI 在工作效率提升方面的一个小示例。然而,AI 的潜力不仅限于工作之外的领域,它也能深入工作场景中,为产品带来实质性的提升。目前,我正在公司开发一个内部素材库平台。实际上,每个公司都拥有自己的设计资源,但这些图片素材通常分散在各处——有些存放在公司的内部平台上,有些仍旧留在设计师的个人电脑中,而有些则遗失在公司的某个尘封文件夹中。问题在于,如何整合公司现有的素材,以便设计师能够在使用时迅速找到所需资源。一般来说,公司会建立素材库平台或指派专人管理内部素材来解决这一问题。但我在建设素材库时发现,简单地将所有素材汇集到一个平台上对设计师并不是很有帮助。他们还需要从中挑选所需素材。如果没有一套规则或系统对素材进行分类管理,使用者面对一大堆素材时会感到头痛。我知道我需要的素材就在这堆里,但就是找不到。到头来,我宁愿上网搜索一张进行修改,或者干脆自己GC一张。因此,对内部素材进行初步筛选变得十分必要:业务、素材类型。这涉及到按照公司内部业务进行分类,以及根据素材的现有类型(如3D、插画、真实图像、纹理氛围等)进行一级筛选,这是最基本的操作。
但由于公司内部许多素材都是 GC 的,命名往往是一串无规律的字符。即便利用算法支持的图像内容识别技术,通过图文搜索能力来快速筛选素材,准确性仍旧不尽如人意,无法全面覆盖所有素材,导致大量素材难以被有效检索。这就凸显了建立一个标签库的必要性。如果有一套完整的标签体系来管理和分类素材,那么通过标签搜索就成为了一种常见的管理方式,类似于在素材网站如花瓣、千图等可以看到的,每个素材下都有一些描述性的标签。这个方向是正确的,但是问题在于如何为初次上传的素材进行标记。理想的情况下,是通过算法基于模型分析图像内容后进行智能打标。
但这里又出现了一个问题,先不论算法打标的准确性,它真的就是识别素材内容后打上相应的元素标签,这样的复用性极低。比如,我上传了一百张素材,它可能会为我生成 100 个不同的标签。如果公司就 3D 风格的素材就有几万张,那么维护一个如此庞大的标签库就变得不现实,丧失了其意义。我点击一个标签可能只能筛选出一张图,这并没有有效地利用标签对素材进行管理。
因此,我开始尝试训练 GPT 来进行自动化打标,并限定在一个预设的标签池中进行选择。这样不仅能实现自动化打标,还能对标签库进行有效管理和维护。我们只需要按照固定的格式去投喂标签库的标签,这一步可以将格式给 GPT,让 GPT 按照该格式针对素材类别进行分类总结,可以快速整理标签库,我以类别维度去搭建的标签格式:
一、主要类别(1)子分类 [具体标签]。
大概整理了 17 个主要类别,基本囊括 80%的图片素材类别,后期也会定期维护更新。
解决了标签自动化的问题之后,我再次尝试上传素材,却发现效率并没有显著提高。因为每当我上传一张素材时,我需要选择业务归属、素材类型、标签,最后还得为素材进行命名。我开始思考,如果这所有的素材信息都能被自动填充,那将大大提高上传效率。因此,我首先对素材进行了全面的命名规范:
业务(判断)-素材类型(判断)-标签一、标签二、标签三-人物描述/物体名称(判断,不超过 4 个字)-动作/场景/特征(判断,不超过 6 个字)。
素材的名称即为:
人物描述/物体名称(判断,不超过 4 个字)-动作/场景/特征(判断,不超过 6 个字)。
例:一张女足的素材。全命名为“业务-3D-青年、运动健身、运动员-女孩-踢球”。