微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期

2024-07-16 05:25

微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程，遗憾的是，你只能每隔几年才能看到一次，因为建造超级计算机然后用它们训练模型都需要时间。”202

微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。

斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程，遗憾的是，你只能每隔几年才能看到一次，因为建造超级计算机然后用它们训练模型都需要时间。”

2020 年，OpenAI 研究人员探索了 LLM 的“规模定律”，该定律表明，随着模型变得更大（参数更多）、训练数据更多以及拥有更强大的计算能力，语言模型的性能往往会呈可预测的提升。这一定律意味着，仅仅增加模型规模和训练数据，就能够显著提升人工智能能力，而无需取得根本性的算法突破。

然而，此后也有其他研究人员对“规模定律”的长期有效性提出质疑。不过，该概念仍是 OpenAI 人工智能研发理念的基石。斯科特所持的乐观态度与部分人工智能领域批评人士的观点形成鲜明对比，一些人认为，大型语言模型的进步在类似 GPT-4 的模型级别已经停滞不前。这种观点主要基于对谷歌 Gemini 1.5 Pro、Anthropic 的 Claude Opus 以及 OpenAI 的 GPT-4o 等最新模型的非正式观察和一些基准测试结果。一些人认为，这些模型并没有像前几代模型那样取得飞跃性的进步，大型语言模型的发展可能正在接近“边际收益递减”的阶段。

AI在线注意到，人工智能领域著名批评人士 Gary Marcus 在今年 4 月写道：“GPT-3 明显优于 GPT-2，GPT-4（发布于 13 个月前）也明显强于 GPT-3。但之后呢？”

斯科特所持的立场表明，像微软这样的科技巨头仍然认为投资大型人工智能模型是合理的，他们押注于持续取得突破。考虑到微软对 OpenAI 的投资以及大力营销自家的人工智能协作工具“Microsoft Copilot”，该公司强烈希望维持人工智能领域持续进步的公众认知，即使技术本身可能遇到瓶颈。

另一位人工智能领域知名批评人士 Ed Zitron 最近在其博客上写道，有些人支持继续投资生成式人工智能的一个理由是，“OpenAI 掌握着我们不知道的某种技术，一项强大而神秘的技术，能够彻底击溃所有怀疑者的质疑。”他写道，“但事实并非如此。”

公众对大型语言模型能力提升放缓的认知，以及基准测试的结果，部分原因可能在于人工智能最近才进入公众视野，而事实上，大型语言模型已经发展多年。OpenAI 在 2020 年发布 GPT-3 之后的三年中一直持续研发大型语言模型，直到 2023 年发布 GPT-4。许多人可能是在 2022 年底利用 GPT-3.5 开发的聊天机器人 ChatGPT 上线后才开始意识到类似 GPT-3 的模型的强大功能，因此在 2023 年 GPT-4 发布时才会觉得能力提升巨大。

斯科特在采访中反驳了人工智能进步停滞的观点，但他同时也承认，由于新模型往往需要数年才能开发，因此该领域的数据点更新的确较慢。尽管如此，斯科特仍然对未来版本的改进充满信心，尤其是在当前模型表现不佳的领域。

“下一个突破即将到来，我无法确切地预测它何时出现，也不知道它会取得多大的进步，但它几乎肯定会改善目前那些不够完善的方面，比如模型的成本过高或过于脆弱，让人难以放心使用，”斯科特在采访中表示，“所有这些方面都会得到改善，成本会降低，模型会变得更加稳定。届时，我们将能够实现更加复杂的功能。这正是每一代大型语言模型通过规模化所取得的成就。”

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后，OpenAI并未停下在该领域探索的脚步，现在这家ChatGPT的创造者再次发力，推出了三款全新的自主研发语音模型，分别为:gpt-4o-transcribe， gpt-4o-mini-transcribe and gpt-4o-mini-tts。其中最受瞩目的当属gpt-4o-transcribe。目前，这些新模型已经率先通过应用程序接口（API）向第三方开发者开放，开发者们可以利用它们打造更智能的应用程序。

3/21/2025 9:01:00 AM

AI在线

OpenAI发布GPT-4.1系列模型：能力全面超越前代

4月15日，OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型，涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。该系列在编程能力、指令理解及长文本处理等方面实现重大突破，全面超越前代 GPT-4o 及 GPT-4o mini。其中，模型上下文窗口扩展至100万 tokens，知识库更新至2024年6月，为复杂任务提供更强支持。

4/15/2025 9:00:45 AM

AI在线

OpenAI发布GPT-4.1系列模型，编码与多模态能力全面升级

人工智能领域的竞争日趋白热化，OpenAI再次以技术突破引领潮流。 AIbase从社交媒体获悉，OpenAI于近日通过API形式发布了三款全新模型:GPT-4.1、GPT-4.1mini和GPT-4.1nano。这些模型在性能上全面超越现有GPT-4o及GPT-4o mini，尤其在编码、指令遵循和多模态能力上表现突出。

4/15/2025 10:01:37 AM

AI在线

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布34页智能体实践指南：从网络搜索到代码编写 OpenAI 新规：组织想要用未来 AI 模型需先“验明正身”

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度苹果人形机器人深度学习 AI视频模态 xAI 驾驶字节跳动文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型

顶部

微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期

相关资讯

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

OpenAI发布GPT-4.1系列模型：能力全面超越前代

OpenAI发布GPT-4.1系列模型，编码与多模态能力全面升级