您正在搜索 gpt-4-shi-ru-he-gong-zuo-de-ha-fo-jiao-shou-qin-zi-jiang-shou

和 GPT-4 并列第一，LMSYS 基准测试显示 Claude-3 模型表现优异

根据 LMSYS Org 公布的最新基准测试报告，Claude-3 得分以微弱优势超越 GPT-4，成为该平台“最佳”大语言模型。IT之家首先介绍下 LMSYS Org，该机构是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织。该机构推出 Chatbot Arena，这是一个针对大型语言模型（LLM）的基准平台，以众包方式匿名、随机对抗测评大模型产品，其评级基于国际象棋等竞技游戏中广泛使用的 Elo 评分系统。评分结果通过用户投票产生，系统每次会随机选择两个不同的大模型机器人和用户聊天

OpenAI 的 GPT 商店审核失控：被指充斥侵权和垃圾内容

旨在提供从编程辅助到健身建议等各种功能的 GPT 模型的 OpenAI GPT 商店正面临质量和合规性问题。据 TechCrunch 调查，该商店存在大量涉嫌侵犯版权的 GPT 模型，例如未经授权生成迪士尼和漫威角色内容的“钢铁侠”GPT 或 “米奇老鼠”GPT。IT之家注意到，尽管 OpenAI 采用了结合自动检测和人工审查的审核制度，但大量的 GPT 模型显然逃过了审核。另一个问题是学术诚信，一些 GPT 模型声称可以绕过内容剽窃检测工具，助长抄袭行为。例如，有两个 GPT 模型，一个声称是高级的改写工具，另一

OpenAI CEO 阿尔特曼：GPT-4“有点糟糕”，今年将推出新模型

OpenAI 首席执行官萨姆・阿尔特曼 (Sam Altman) 在周一发布的与列克斯・弗里德曼 (Lex Fridman) 的访谈中表示，他们公司的人工智能模型 GPT-4 其实“有点糟糕（kinda sucks）”，阿尔特曼更期待即将到来的 GPT-5 能够真正配得上大家的期待。“我认为它有点糟糕，” 当被问及 GPT-4 及其最令人印象深刻的能力时，阿尔特曼说道，“展望未来几年，我们应该意识到我们现在拥有的工具将来看来会非常落后，这正是鞭策我们不断进步、创造更美好的未来的动力。”“别误会，我既不想贬低 GPT

OpenAI 官方博客提前泄露 GPT-4.5 Turbo，有望今年夏天发布

感谢OpenAI 近期可能意外泄露了旗下即将发布的 GPT-4.5 Turbo 大型语言模型信息。网友发现，OpenAI 博客上疑似上线了一篇有关 GPT-4.5 Turbo 的文章，但该页面目前已被撤回，搜索引擎也无法再检索到相关信息。泄露的信息显示，GPT-4.5 Turbo 将在速度、准确性和可扩展性方面全面超越其前代 GPT-4 Turbo。更关键的是，泄露的描述中提到了该模型的“知识截止日期”为 2024 年 6 月。这一信息引发了诸多猜测，有人认为是笔误，也有人推测 OpenAI 可能会在今年 7 月或

Sora 团队负责人称 Sora“还不是一个产品”，短期不会向公众开放

感谢近日，YouTube 频道 WVFRM Podcast 在其节目中，邀请了 OpenAI 旗下文生视频模型 Sora 的核心团队成员参与访谈。IT之家注：三名成员包括 Bill Peebles、Tim Brooks 和 Aditya Ramesh，均为 Sora 项目负责人。这三名负责人谈到了 Sora 何时可供用户使用的问题，其称目前 Sora 仍处于反馈获取阶段，“还不是一个产品，短期之内不会向公众开放。”对于什么时候把它变成一个产品，我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它，但

强如 GPT-4，也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试

编译 | 赖文昕编辑 | 陈彩娴语言大模型能依据人类设定的规则生成内容吗？这背后关乎人类用户使用大模型的安全问题。例如，AI 科技评论想使用 GPT-4 制作一张包含对话框的图片，但没有针对目标生成对话的内容给予明确指示，而 GPT-4 生成的图文效果便如下，显示文本逻辑混乱、字不成章，还有部分“重影”：语言大模型能否遵循人类指示生成合格内容，是人类能否操控人工智能的重要评测标准之一。

GPT-4.5 Turbo意外曝光，官方网页被扒出，网传明天就上线

虽然没等到 GPT-5 的消息，但我们离 GPT-4.5 不远了。Claude 3 一经推出，AI 初创公司 Anthropic 被推上了大模型浪潮顶端。这一波压力立马给到了 OpenAI。不少网友调侃，GPT-5 呢？由于 OpenAI 每次都能给我们超乎想象的 AI 体验惊喜，大家不由得对他们的实力有着更高期待。GPT-5 的发布时机或许还扑朔迷离，但我们离 GPT-4.5 的发布可能真的不远了。最新消息显示，OpenAI 的 GPT-4.5 Turbo 在 Bing 和 DuckDuck Go 等搜索引擎已经

万物皆可《毁灭战士》，专家利用 GPT-4V 模型运行该游戏

英国约克大学研究员 Adrian de Wynter 近日发表研究论文《Will GPT-4 Run DOOM?》，探讨了如何让 GPT-4V 模型来玩《毁灭战士》游戏。de Wynter 为此设计了一个系统，使用 GPT-4V（GPT4 的多模态衍生版本，可以接收图像作为输入）捕捉游戏引擎的画面截图，并返回游戏状态的结构化描述。他设计了一个 Agent 模型，根据视觉输入信息，并对比此前历史记录作出决策，并将其反应转化为《毁灭战士》游戏可以理解的按键命令。简单地说，系统会截取游戏截图，并利用这些截图找出游戏中发生

微软 Copilot 全面升级 OpenAI GPT-4 Turbo 模型，包括免费用户

在经过一系列工作之后，微软现已针对 Copilot 用户群全面升级为 OpenAI 最先进的 GPT-4 Turbo 模型。IT之家提醒，Copilot Pro 用户如果不习惯的话还可以切换回标准 GPT-4 模型，但免费用户是没有选择权的。微软 Copilot 最初是作为 Bing Chat 聊天机器人推出的一款产品，早期迭代依赖于 GPT-3.5 模型，后来升级到 GPT-4 后有了大幅改进，而现在又升级到了 GPT-4 Turbo 模型，这意味着 Copilot 功能又一次实现飞跃。GPT-4 Turbo 以

阿尔特曼、老黄齐预测：AGI 五年内降临，代替 95% 工作！但马斯克断言 AGI 将被电力卡脖子

感谢IT之家网友 lemon_meta 的线索投递！【新智元导读】突然间，AGI 已经成为了一个新的「5 年内实现」的未来技术。从 Altman 到老黄，都在不同场合表示，达到人类智能水平的 AI 将很快到来。而技术路径和未来可能出现的能源短缺，可能是达到 AGI 过程中的最大变数。Claude 3、Sora、Gemini 1.5 Pro 的纷纷出现，以及或许今年内就会被放出的 GPT-5，让所有人都不约而同地隐隐感觉：我们似乎离 AGI 似乎越来越近了。OpenAI CEO Sam Altman 坚定地认为，AG

AI 结合汽车，蔚来宣布 NOMI GPT 领航版开启招募

蔚来汽车今日宣布，2024 NOMI 焕新，GPT 领航版正式开启招募。经历 132 次版本迭代更新、为用户带来了超 2000 项功能的 NOMI，即将进入体验升级新篇章。官方称登陆蔚来 App，关注用户领航团发布的最新招募信息。然而，IT之家暂未找到招募入口，评论区网友也表达了同样的疑惑，蔚来对此表示“别着急，刷一刷就上线了”。IT之家注意到，2024 款蔚来全系车型均将采用全新的中央计算平台 ADAM，搭载高通骁龙 8295 座舱芯片，座舱算力得到明显提升。其中，8295 芯片相较于 8155 芯片，CPU 算

微软开始为 Copilot Pro 用户推出创建自定义 GPT 功能

微软 Bing 副总裁 Michael Schechter 表示，微软已经开始面向 Copilot Pro 用户推出 Copilot GPT Builder 功能，允许用户打造属于自己的自定义 AI 机器人。如图所示，微软 Copilot GPT Builder 目前正在分阶段推出，拥有体验资格的 Copilot Pro 用户可以看到一个新的预览功能，点击即可通过自定义配置创建一个个性化 Copilot GPT。微软今年 1 月为 Copilot 推出了一项可选订阅服务 Copilot Pro，每月收费 20 美元

53页PDF广泛流传，核心员工相继离职，OpenAI到底有什么秘密？

八卦络绎不绝，GPT-5 却一直没来。一份关于「OpenAI 在 2027 年实现 AGI」的 53 页 PDF，正在互联网上广泛流传。文档来源于一个名为「vancouver1717」的 X 账户，该账户注册于 2023 年 7 月，只有两条推文。最新发布的这个 PDF 文档称，OpenAI「将在 2027 年前开发出人类水平的 AGI」，「从 2022 年 8 月就在训练 125 万亿参数的多模态模型」，而且已经「在 2023 年 12 月完成了训练」，但是「由于高推理成本取消了发布」。其中提到，这个模型就是原计

模型偏好只与大小有关？上交大全面解析人类与32种大模型偏好的定量组分

在目前的模型训练范式中，偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中，偏好数据通常被用作对齐（alignment）时的训练优化目标，如基于人类或 AI 反馈的强化学习（RLHF/RLAIF）或者直接偏好优化（DPO），而在模型评估中，由于任务的复杂性且通常没有标准答案，则通常直接以人类标注者或高性能大模型（LLM-as-a-Judge）的偏好标注作为评判标准。尽管上述对偏好数据的应用已经取得了广泛的成效，但对偏好本身则缺乏充足的研究，这很大程度上阻碍了对更可信 AI 系统的构建。为此，上海交通大学生成式

6000字干货！全面了解顶尖AI产品 ChatGPT-4

GPT-4 的看点都有哪些呢？逻辑推理，强到可以代替你考律师啦角色扮演，cosplay 认定角色不轻易被忽悠多模态，可以看到图片啦更安全，想要再轻易忽悠它越狱很难了GPT-4 的论文：搭载了 GPT-4 的 ChatGPT Plus：申请 GPT-4 的 API：接下来的内容会详细介绍 GPT-4 的一切。GPT-4 具有更广泛的通识知识和问题解决能力，可以更有效的解决难题 1. 它更有创造力 GPT-4 比以往任何时候都更具创造性和协作性。它可以与用户一起生成、编辑和迭代创意和技术写作任务，例如

讯飞星火V3.5正式发布，基于全国产算力平台“飞星一号”训练

1月30日，科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5。2023年10月24日，科大讯飞携手华为，宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里，讯飞星火基于“飞星一号”，启动了对标GPT-4的更大参数规模的大模型训练，带来了1月30日这场讯飞星火V3.5升级发布。首个基于全国产算力训练的全民开放大模型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能

OpenAI官方下场修复GPT-4变懒，上新多个模型、还大降价

今天，OpenAI 一口气宣布了 5 个新模型，包括两个文本嵌入模型、升级的 GPT-4 Turbo 预览版和 GPT-3.5 Turbo、一个审核模型。不知大家是否还记得，去年年底 GPT-4 开始变「懒」的事实。比如在高峰时段使用 GPT-4 或 ChatGPT API 时，响应会变得非常缓慢且敷衍，有时它会拒绝回答用户提出的问题，甚至还会单方面中断对话。这种情况对于码农来说，更是深有体会，有人抱怨道「让 ChatGPT 扩展一些代码，它竟然让我自己去写。」原本想借助 ChatGPT 帮助自己编写代码，现在好

ChatGPT应用商店终上线，全网GPTs超300万，和OpenAI分钱时代来了

收入分成标准还未确定。ChatGPT 也要像微信、钉钉那样变成全功能 App 了？1 月 10 日，OpenAI 的应用商店 GPT Store 正式上线，分类、趋势、每周精选等栏目一应俱全。正像大部分应用商店那样，GPT Store 包括流行下载的社区排行榜，用户可以按类别搜索，例如写作、生活方式和教育。OpenAI Greg Brockman 表示，这是打造自己的 ChatGPT 的第一步。该产品仍在试验阶段，但希望在未来几周内更广泛地推广。OpenAI 还将在每周重点介绍有用和有影响力的特色 GPT。第一批特

gpt-4-shi-ru-he-gong-zuo-de-ha-fo-jiao-shou-qin-zi-jiang-shou 的搜索结果