chatgpt

消息称 OpenAI 公司 2024 年资金缺口达到 50 亿美元

科技媒体 The Information 昨日（7 月 24 日）发布博文，爆料称 OpenAI 目前用于 AI 推理的算力，预估相当于 35 万台包含英伟达 A100 芯片的服务器，其中约 29 万台用于 ChatGPT，而且近乎满负荷运行。报道称截至今年 3 月，OpenAI 公司花费近 40 亿美元使用微软服务器为 ChatGPT 运行推理工作负载；此外 OpenAI 今年训练 ChatGPT 以及新 AI 模型的成本预估达到 30 亿美元，因此训练和推理 AI 的成本可能达到 70 亿美元（AI在线备注：当

7/25/2024 2:57:08 PM

故渊

RLHF不够用了，OpenAI设计出了新的奖励机制

OpenAI 的新奖励机制，让大模型更听话了。自大模型兴起以来，使用强化学习从人类反馈（RLHF）中微调语言模型一直是确保 AI 准确遵循指令的首选方法。为了确保 AI 系统安全运行并与人类价值观保持一致，我们需要定义期望行为并收集人类反馈来训练「奖励模型」。这种模型通过发出期望的动作来指导 AI。但是，收集这些常规和重复任务的人类反馈通常效率不高。此外，如果安全政策发生变化，已经收集的反馈可能会过时，需要新的数据。我们能否构建一种新的机制来完成这些任务？近日，OpenAI 公布了一种教导 AI 模型遵守安全政策的

7/25/2024 1:47:00 PM

机器之心

OpenAI 调岗 AI 安全高管 Aleksander Madry，新职位专注于 AI 推理

OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）本周二在 X 平台发布推文，表示在新一轮内部架构重组中，负责 AI 安全的主管亚历山大・马德里（Aleksander Madry）调岗，并将其重新分配到一个专注于人工智能推理的岗位。阿尔特曼在推文中表示：“Aleksander 正在从事一个新的、非常重要的研究项目”。阿尔特曼补充表示，OpenAI 高管华金・基诺内罗・坎德拉（Joaquin Quinonero Candela）和莉莉安・翁（Lilian Weng）将在此期间接管 Preparedness

7/24/2024 8:46:16 AM

故渊

发布 GPT-4o Mini 后，OpenAI CEO 阿尔特曼称产品命名方式“需要改变”

7 月 18 日，OpenAI 发布了号称“最具成本效益小模型”的新模型 GPT-4o Mini。随后，CEO 阿尔特曼在 X（推特）上开启了“带货模式”：“每百万输入 tokens 15 美分，每百万输出 tokens 60 美分，MMLU 为 82%，速度快。最重要的是，我们认为人们会非常喜欢使用这个新模型。”大部分网友在评论区中赞不绝口，但也有网友认为，GPT 系列模型的名称是时候需要改一改了。在回复阿尔特曼的推文时，这名网友表示，“你们真的需要换个名字。”阿尔特曼给出了肯定的回复。“哈哈，是的，我们确实需要

7/22/2024 5:27:20 PM

清源

巨头人才之战热度升级：xAI 创立未足年，创始工程师 Kosic 离职重返老东家 OpenAI

2024 年 AI 人才争夺战硝烟弥漫战况升级，马斯克与 OpenAI 纠葛不断再结新梁子，就在 xAI 完成巨额融资前，核心成员 Kosic 竟重返 OpenAI。2024 年作为 AI 应用元年，整个行业迎来「黄金时代」。随着 AI 军备竞赛的正式打响，如果说有什么比 H100 更令大佬们心动的，那便是顶尖 AI 人才。扎克伯格和谢尔盖・布林和马斯克等大佬纷纷亲自下场参与 AI 人才争夺战，开百万年薪，享股票期权。Meta 首席执行官扎克伯格亲自撰写电子邮件，试图从谷歌的 AI 团队 Deep Mind 招募

7/19/2024 6:49:03 PM

清源

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

美国时间 7 月18 日，OpenAI 正式发布了多模态小模型 GPT-4o mini，在海内外引起了广泛关注。此前，OpenAI 凭借 GPT-3 开拓了 AI 模型的“暴力美学”时代，同时也以训练超大参数规模的模型能力建立起 AGI 同赛道的护城河。但在其推出 GPT-4o 的“Mini”版本之后，OpenAI 似乎走向了原有优势的反方向，开始卷“小模型”，而值得注意的是：在 Mini 这条路上，欧洲与中国的大模型团队已经率先研究了大半年。

7/19/2024 4:07:00 PM

朱可轩

GPT-4o Mini深夜突发：即刻免费上线，API降价60%

大模型向小了。还没「休息」几天，AI 大模型再次卷起来了。刚刚，OpenAI 突然宣布了「Mini」版本的 GPT-4o 模型。该公司表示，新的轻量级版本旨在让更多公司和项目能够获得最先进的技术。这款名为 GPT-4o mini 的新模型立即上线，它在 MMLU 上的得分为 82%，目前在 LMSYS 排行榜的聊天方面分数优于 GPT-4。除了立即在 ChatGPT 免费版、付费版上可用以外，GPT-4o mini 的商用价格是每百万输入 token 15 美分，每百万输出 token 60 美分 —— 比之前的

7/19/2024 3:03:00 PM

机器之心

提示词用上“过去式”，秒破 GPT-4o 等六大模型安全限制：中文语境也好使

只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。而且对 GPT-4o 尤其有效，原本只有 1% 的攻击成功率直接飙到 88%，几乎是“有求必应”。有网友看了后直言，这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文，揭开了这个大模型安全措施的新漏洞。而且攻击方式简单到离谱，不用像“奶奶漏洞”那样专门构建特殊情境，更不必说专业对抗性攻击里那些意义不明的特殊符号了。只要把请求中的时间改成过去，就能让 GPT-4o 把燃烧弹和毒品的配方和盘托出。而且量子位实测发现，把提示词改成中文，

7/19/2024 2:57:57 PM

清源

GPT-4o mini一手测评：懂得不多，但答得极快

GPT-4o mini主打一个字「快」。昨晚，OpenAI 突然上线新模型 GPT-4o mini，声称要全面取代 GPT-3.5 Turbo。在性能方面，GPT-4o mini 在 MMLU 上的得分为 82%，在 LMSYS 排行榜的聊天方面分数优于 GPT-4。在价格方面，GPT-4o mini 比之前的 SOTA 模型便宜一个数量级，商用价格是每百万输入 token 15 美分，每百万输出 token 60 美分，比 GPT-3.5 Turbo 便宜 60% 以上。OpenAI 表示，ChatGPT 的免

7/19/2024 2:53:00 PM

机器之心

Anthropic 联设 1 亿美元 AI 初创基金；OpenAI推出“小”模型GPT-4o Mini；通义千问大模型技术骨干周畅将离职创业丨AI情报局

今日融资快报Anthropic 联手硅谷风险投资公司 Menlo Ventures 设立 1 亿美元 AI 初创基金Menlo Ventures 是 Anthropic 的重要投资者之一，双方合作推出了名为 Anthology Fund 的 1 亿美元人工智能初创基金，旨在投资于人工智能领域的种子前、种子和 A 轮公司。该基金将为初创企业提供从 10 万美元起步的投资，并提供 25 万美元的信用额度以使用 Anthropic 的模型。 Menlo 将利用其自家的机器学习工具来评估和排名申请，并承诺对表现出色的公司进行后续融资的支持。

7/19/2024 10:39:00 AM

我在思考中

阿尔特曼深夜发动价格战：OpenAI GPT-4o mini 全新小模型登场，GPT-3.5 退役

感谢AI在线网友刺客的线索投递！OpenAI，也开始进军小模型了。就在今天深夜，GPT-3.5 退场，全新发布的 GPT-4o mini，更小、性能更强，更重要的是 —— 更便宜！▲ GPT-3.5，再见！每百万个输入 token 15 美分，每百万个输出 token 60 美分，MMLU 得分 82%，性能超快。CEO Sam Altman 感慨道：通往智能的成本，竟是如此低廉。是的，如火如荼的大模型价格战，OpenAI 也入场了。Altman 回顾说：就在 2022 年，世界上最好的模型是还是 text-d

7/19/2024 10:36:47 AM

汪淼

OpenAI 推出 AI 模型 GPT-4o mini，号称功能最强、成本效益最高的小模型

感谢据 CNBC 报道，OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”，这是 OpenAI 为扩大其聊天机器人的使用范围所做的最新努力。OpenAI 方面称，此次新发布的产品将是“目前功能最强大、成本效益最高的小型模型”，并计划晚些时候将图像、视频和音频能力整合到该模型中。GPT-4o mini 同样也是 OpenAI 推动“多模态”（multimodality）技术发展的一部分，“多模态”是指在一个工具中提供多种类型的人工智能生成媒体，如文本、图像、音频和视频。据悉，GPT-4o mini

7/18/2024 10:30:26 PM

清源

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了

如果 AI 模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是，要求系统对其输出产生一种解释，这种解释对人类或另一个受信任的系统来说是可读的，即可以完全理解以至于任何可能的错误都可以被发现。例如，为了建立对司法系统的信任，我们要求法院提供清晰易读的书面意见，解释并支持其决策。对于大型语言模型来说，我们也可以采用类似的方法。不过，在采用这种方法时，确保语言模型生成的是易于理解

7/18/2024 2:36:00 PM

机器之心

微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期

微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存在着一个指数级提升的过程，遗憾的是，你只能每隔几年才能看到一次，因为建造超级计算机然后用它们训练模型都需要时间。”202

7/16/2024 5:25:59 PM

远洋

传 4050 亿参数版 Llama3 将在 23 日发布；机械臂公司获 6300 万美元融资丨AI情报局

今日融资快报机械臂公司 Standard Bots 获 6300 万美元融资，亚马逊、三星等参投Standard Bots Inc. 是一家为制造业和物流业开发机械臂的初创公司，该公司已获得 6300 万美元的 B 轮新资金。本轮融资由 General Catalyst 领投，亚马逊工业创新基金、Samsung Next 和几家老投资者也参与了该公司的投资。

7/15/2024 6:09:00 PM

我在思考中

非法阻止员工披露AI安全风险，OpenAI严厉「封口协议」再遭举报

OpenAI 在人工智能领域的领头羊地位家喻户晓。其产品聊天机器人 ChatGPT 系列、文生图 DALL・E 系列、文生视频 Sora 等都被誉为生产力提升的超强助手据透露，OpenAI 内部正在一个代号为「草莓（Strawberry）」的项目中开发一种新的人工智能模型。该项目的细节此前从未被报道过，而 OpenAI 正努力证明其提供的各类模型能够提供高级推理能力。不过 OpenAI 现在似乎正陷在另一场风波当中。据《华盛顿邮报》报道，一位举报人向美国证券交易委员会（SCE，Securities and Exch

7/15/2024 11:52:00 AM

机器之心

OpenAI Lilian Weng万字长文解读LLM幻觉：从理解到克服

Lilian Weng 出品，必是精品。人会有幻觉，大型语言模型也会有幻觉。近日，OpenAI 安全系统团队负责人 Lilian Weng 更新了博客，介绍了近年来在理解、检测和克服 LLM 幻觉方面的诸多研究成果。Lilian Weng，中文名翁丽莲，是 OpenAI 安全系统团队负责人。她 2018 年加入 OpenAI，参与了 GPT-4 项目的预训练、强化学习 & 对齐、模型安全等方面的工作。她的博客深入、细致，具有前瞻性，被很多 AI 研究者视为重要的参考资料（其他博客见文末扩展阅读）。大型语言模型的幻觉

7/15/2024 11:34:00 AM

机器之心

模型训练成本“平民化”，前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2

GPT-2 是 OpenAI 于 2019 年推出的模型，其训练费用一度为每小时 256 美元，那么 5 年过后的 GPT-4 时代，软硬件和数据的进步，是否意味着训练同一模型所需的时间和成本会随之减少呢？答案是肯定的。据 Tom's Hardware 今日报道，前特斯拉 AI 总监、OpenAI 联合创始人、项目开发者 Andrej Karpathy 使用 llm.c“重现”了 GPT-2，其成本降到了每小时仅 28 美元（AI在线备注：当前约 204 元人民币），在短短 5 年内降低了近 90%。图源 Pixa

7/13/2024 9:58:53 PM

清源

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发 OpenAI发布GPT-4.1指令提示工程指南

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉大型语言模型训练