您正在搜索 gpt-wei-jing-de-ge-ming-you-o1-jie-bang-huo-shi-llm-yan-jiu-zui-zhong-yao-de-fa-xian

零一万物新旗舰模型 Yi-Lightning 发布：LMSYS 测试国产首次超越 GPT-4o，中国第一、世界第六

感谢李开复创办的 AI 公司零一万物于 10 月 16 日对外发布新旗舰模型 Yi-Lightning。在盲测榜单 LMSYS 上，Yi-Lightning 超越 OpenAI、Anthropic 所发布的 GPT-4o-2024-05-13、 Claude 3.5 Sonnet，排名世界第六，中国第一。零一万物表示，这是在 LMSYS 这一全球大模型必争的公开擂台上，中国大模型首度实现“超越 OpenAI GPT-4o ”的最佳成绩（AI在线注：此处 GPT-4o 为 OpenAI 于 5 月发布的 GPT-4o-2024-05-13）。

OpenAI GPT-4 解锁新成就：100% 识别性别、74.25% 识别年龄范围，未专门训练可媲美专业算法

科技媒体 The Decoder 昨日（10 月 9 日）发布博文，报道称最新研究表明 OpenAI 的 GPT-4 AI 模型在未经专门微调和训练情况下，能够识别面孔、判断性别，并在照片中估计年龄，其准确度媲美专业算法。来自挪威科技大学、Mizani 及 Idiap 研究所的研究人员推进这项研究，测试了 GPT-4 的生物识别能力，发现其性能和 MobileFaceNet 等专门的面部识别算法不相上下。在性别识别测试中，GPT-4 在 5400 张平衡（balanced）图像的数据集上取得了 100% 的准确率，

微调 GPT-4o AI 模型新维度，OpenAI 开放图片视觉微调功能

OpenAI 公司昨日（10 月 1 日）发布博文，宣布为 GPT-4o 模型引入视觉微调（vision fine-tuning）功能，除了文本之外还支持微调图像。OpenAI 表示自开放微调 GPT-4o 以来，数十万开发者使用数据集（仅文本）微调了该模型，从而提高了驾驭某些特定任务的能力。OpenAI 在博文中展示了一些合作伙伴的微调案例：Garb ：通过视觉微调，提升了交通标志定位准确性 20% 和限速标志定位 13%。Automat：成功率从 16.60% 提升至 61.67%，并在信息提取任务中 F1 分

《Python机器学习》作者科普长文：从头构建类GPT文本分类器，代码开源

学起来吧！近日，机器学习研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又分享了一篇长文，主题为《从头开始构建一个 GPT 风格的 LLM 分类器》。文章展示了如何将预训练的大型语言模型（LLM）转化为强大的文本分类器。AI在线对文章内容进行了不改变原意的编译、整理：为什么要关注分类呢？首先，针对分类任务，对预训练模型进行微调是一个简单有效的 LLM 知识入门方式。其次，文本分类有许多商业应用场景，比如：垃圾邮件检测、情感分析、客户反馈分类、主题分类等等。阅读完本文，你将找到以下

实测字节豆包·视频生成模型：Sora画的饼被实现了......

但更多的网友则是期待字节的视频生成模型，因为早在去年11月，字节的项目Make Pixels Dance就展示字节具备了解决长AI视频中角色一致性难以保持的问题。所以我也看到很多外网网友的另一个问题“Where is ByteDacne?”。而就在9.24火山引擎AI创新巡展深圳站上，火山引擎一口气发布了个视频生成模型PixelDance和Seaweed模型。

GPT-4o 能玩《黑神话：悟空》：精英怪胜率超人类，无强化学习纯大模型方案

AI 玩黑神话，第一个精英怪牯护院轻松拿捏啊。有方向感，视角也没有问题。躲闪劈棍很丝滑。甚至在打鸦香客和牯护院时，AI 的胜率已经超过人类。而且是完全使用大模型玩，没有使用强化学习。阿里巴巴的研究人员们提出了一个新型 VARP（视觉动作角色扮演）智能体框架。它能直接将游戏截图作为输入，通过视觉语言模型推理，最终生成 Python 代码形式的动作，以此来操作游戏。以玩《黑神话・悟空》为例，该智能体在 90% 简单和中等水平战斗场景中取胜。GPT-4o、Claude 3.5 都来迎战研究人员以《黑神话・悟空》为研究平台

研究称生成式 AI 耗水量巨大：使用 GPT-4 生成 100 字文本需消耗 3 瓶水

据《华盛顿邮报》报道，美国加州大学河滨分校的一项新研究揭示了生成式 AI 的惊人环境成本，尤其是其对水资源的消耗。研究发现，即使只是生成文本，AI 也需要大量的水来冷却服务器。再加上其对电网的巨大压力，进一步凸显了 AI 发展的环境挑战。图源 Pexels研究指出，AI 的用水量因州和数据中心位置的不同而有所差异，但总体而言，水耗与电费成反比。AI在线注意到，得州的水耗最低，生成一封 100 字的电子邮件仅需 235 毫升水，而华盛顿则高达 1,408 毫升，相当于三瓶 16.9 盎司的矿泉水。此外，数据中心本身就

新代码暗示 OpenAI 本月 24 日推出 ChatGPT AI 高级语音模式

科技媒体 testingcatalog 昨日（9 月 18 日）发布博文，报道称 OpenAI 公司可能会在 9 月 24 日进一步推广 ChatGPT 的高级语音模式，甚至可能是直接正式发布。OpenAI 于今年 7 月宣布向一小部分 ChatGPT Plus 用户开放 ChatGPT 的高级语音模式，让用户首次获得 GPT-4o 的超现实音频响应。AI在线援引该媒体报道，OpenAI 公司已更新高级语音模式 FAQ 页面，在代码中被发现“hasSeenAdvancedVoice/2024-09-24”的字符串，

刚刚，GPT-4o关键人物离职创业！曾在OpenAI最早提出构建「Her」

OpenAI 最早提出构建「Her」的那个人，刚刚宣布离职创业了。今年 5 月份，OpenAI 发布了震惊世界的 GPT-4o。这个模型可以跨越文本、视觉和音频，以一种非常自然的形式和人类语音对话，延迟低到与人类在对话中的响应时间相似。而且，它允许用户随时打断，并能感知和回应用户的情绪。因此，该模型发布后，很多人说科幻电影《Her》中的场景照进了现实。此次离职的 Alexis Conneau 就是 GPT-4o 项目的关键人物之一。离职前，他是 OpenAI 音频 AGI 研究负责人，也是 OpenAI 最早提出

从零到AI高手：用OpenAI API极速打造智能应用！

像我之前也提到过，AI 的发展愈发迅猛这是无可置疑的，但很多人知道 AI 好，却不会引进实际的业务中去。无论是市面上常见的文本生成工具，还是智能 Copilot，这些应用都展示了 AI 的强大能力。面对这些新技术，许多设计师可能会好奇：如何才能将这些能力运用到自己的项目中？其实你能用且会用 AI 工具做端外提效已经超过 80%的人了，但如何将能力接入端内？实实在在的给项目提效，而非个人。有些底层逻辑你还是要懂的。 OpenAI 的 GPT 模型是当前自然语言处理领域的核心技术之一。它不仅功能强大，而且极具灵活性，能

OpenAI 今年启动 GPT Next 计划：AI 性能百倍级跃升，Orion 有望接棒 GPT-4

OpenAI Japan 出席 KDDI 峰会，介绍了公司即将推出的下一代 AI 模型，并宣布将在 2024 年启动 GPT Next 计划，有望在 AI 功能上实现大幅飞跃。图源：itmediaOpenAI Japan 首席执行官长崎忠雄（Tadao Nagasaki）表示，虽然 GPT-3 和 GPT-4 的性能比较接近，但 GPT Next 预计会有更大的飞跃，性能将提高 100 倍。长崎忠雄于 2024 年 4 月成为 OpenAI Japan 的掌舵者，他在会上强调相比较传统软件，AI 技术正以指数级速度

OpenAI 的 GPT-4 变身考证能手：无额外训练通过日本理疗师考试，正确率 73.4%

一项新的同行评审研究表明，OpenAI 的 GPT-4 大语言模型无需任何额外训练，即可通过日本国家理疗考试。最新发表在《Cureus》杂志上的新研究，测试了 GPT-4 的文字和视觉技能。AI在线注：日本国家物理理疗师考试包括 160 道综合题和 40 道实践题，测试记忆、理解、应用、分析和评估能力。研究人员在 GPT-4 中输入了 1000 个问题，并将答案对比了官方解决方案。GPT-4 通过了所有五个测试部分，正确回答了 73.4% 的问题。不过，人工智能在处理技术性问题和包含图片或表格的问题时显得有些吃力。

用户反馈 Claude AI 聊天机器人愈发“慵懒”，官方回应未做调整

科技媒体 The Decoder 昨日（8 月 28 日）发布博文，报道称 Anthropic 公司旗下的 Clause AI 聊天机器人变得愈发“慵懒”了，不再像此前那样能干了。网友 NextgenAITrading 于 11 天前在 Reddit 社区发帖，帖子标题为《这绝不是你的幻觉！Claude 最近变得越来越懒了》，目前该帖子已收获 485 个赞，共有 290 条跟帖回复。网友称 Claude 很容易忘记任务，在基础编程方面也很吃力，最终导致其选择取消订阅。Anthropic 公司的亚历克斯・艾伯特（Al

安卓 / macOS 版 ChatGPT AI 应用现支持“@”，可无缝切换不同 GPT 模型

科技媒体 testingcatalog 昨日（8 月 28 日）发布博文，报道称安卓版和 macOS 版 ChatGPT 现支持 Mentions 功能，用户在聊天对话中使用“@”字符来调用不同的定制 GPT 模型。在安卓版 ChatGPT 应用中，用户输入“@”符号之后，会弹出一个窗口，让用户选择不同的 GPT，在保持聊天上下文的时候方便用户无缝切换。苹果 macOS 平台最新版 ChatGPT 也已上线该功能，但目前 iOS 平台 ChatGPT 仍未上线。AI在线注：Mentions 是 ChatGPT 的一

OpenAI GPT-4 AI 模型潜力挖掘：高精度建模基础蛋白质结构

科技媒体 The Decoder 昨日（8 月 21 日）发布博文，报道称罗格斯大学的一项研究表明，OpenAI 公司的 GPT-4 语言模型能高精度模拟简单的氨基酸和蛋白质结构。相关研究成果发表在《Scientific Reports》上，该科研团队使用 GPT-4 AI 语言模型，探索其在基本结构生物学任务中的表现，结果发现该 AI 模型可以准确预测分子结构。科学家们要求 GPT-4 建立 20 种标准氨基酸的三维结构模型，在反馈结果中准确地预测了原子组成、键长和角度，不过 GPT-4 在模拟环状结构和立体化学

OpenAI 开放 GPT-4o 定制功能，企业可更轻松打造专属 AI 助手

OpenAI 推出了一项新功能，允许企业客户使用自己的数据来定制其最强大的 AI 模型 GPT-4o。此举旨在应对日益激烈的 AI 企业应用竞争，并满足企业对 AI 投资回报的更高要求。所谓定制，即业界所称的“微调（fine-tuning）”。通过微调，现有 AI 模型可以针对特定任务或领域进行优化。例如，一家滑板公司可以微调 AI 模型，使其成为能够回答有关轮子和滑板护理问题的客服聊天机器人。此前，OpenAI 仅允许用户微调其较小的模型，如 GPT-4o mini。而此次开放 GPT-4o 和 GPT-4 的微

Llama 8B 搜索 100 次超越 GPT-4o，推理 + 搜索即可提升性能

最新论文表明，LLM 等生成模型可以通过搜索来扩展，并实现非常显著的性能提升。另一个复现实验也发现，让参数量仅 8B 的 Llama 3.1 模型搜索 100 次，即可在 Python 代码生成任务上达到 GPT-4o 同等水平。强化学习先驱、加拿大阿尔伯塔大学 CS 系教授 Rich Sutton 曾在 2019 年写下一篇名为《The Bitter Lesson》的博文，成为 AI 领域的经典论述之一。甚至，Rich Sutton 在字里行间体现出的直觉已经颇有 Scaling Law 的意味。原文地址： /

OpenAI 发布 GPT-4o 模型卡：概述 AI 安全和风险缓解措施

OpenAI 公司于 8 月 8 日发布报告，概述了 GPT-4o 模型的系统卡（System Card），介绍了包括外部红队（模拟敌人攻击）、准备框架（Preparedness Framework）在内的诸多细节。OpenAI 表示 GPT-4o 模型的核心就是准备框架（Preparedness Framework），这是一种评估和降低人工智能系统相关风险的系统方法。AI在线从报道中获悉，该框架主要用于识别网络安全、生物威胁、说服和模型自主性等领域的潜在危险。除了针对 GPT-4 和 GPT-4V 进行的安全评估

gpt-wei-jing-de-ge-ming-you-o1-jie-bang-huo-shi-llm-yan-jiu-zui-zhong-yao-de-fa-xian 的搜索结果