chatgpt

研究发现，OpenAI 的 GPT-4o 道德推理能力胜过人类专家

近期的一项研究表明，OpenAI 最新的聊天机器人 GPT-4o 能够提供道德方面的解释和建议，且质量优于“公认的”道德专家所提供的建议。据 The Decoder 当地时间周六报道，美国北卡罗莱纳大学教堂山分校和艾伦 AI 研究所的研究人员进行了两项研究，将 GPT 模型与人类的道德推理能力进行比较，以探讨大语言模型是否可被视为“道德专家”。IT之家汇总研究内容如下：研究一501 名美国成年人对比了 GPT-3.5-turbo 模型和其他人类参与者的道德解释。结果表明，人们认为 GPT 的解释比人类参与者的解释更

6/24/2024 8:27:01 AM

清源

斯坦福大模型评测榜 Claude 3 排名第一，阿里 Qwen2、零一万物 Yi Large 国产模型进入前十

斯坦福大学基础模型研究中心（CRFM）6 月 11 日发布了大规模多任务语言理解能力评估（Massive Multitask Language Understanding on HELM）排行榜，其中综合排名前十的大语言模型中有两款来自中国厂商，分别是阿里巴巴的 Qwen2 Instruct（72B）和零一万物的 Yi Large（Preview）。据悉大规模多任务语言理解能力评估（MMLU on HELM）采用了 Dan Hendrycks 等人提出的一种测试方法，用于衡量文本模型在多任务学习中的准确性。这个测试

6/22/2024 8:17:14 PM

满河（实习）

生成式 AI“上车”，大众高尔夫、途观、帕萨特等海外版车型现已支持 ChatGPT

当地时间 21 日，大众汽车宣布配备新一代信息娱乐系统的车型现已加入对 ChatGPT 的支持。在欧洲地区，引入 ChatGPT 的车型包括纯电动 ID.系列、新款高尔夫、新款途观、新款帕萨特，用户可通过车辆内置 IDA 语音助手访问 ChatGPT。据介绍，AI“上车”之后带来的体验远远超出以往，用户可以要求汽车直接读出搜索结果，或使用自然语言与汽车进行交互。例如，接入 ChatGPT 的车机可以提供旅游景点信息、报道过去的足球比赛或帮助解决数学问题。驾驶员只需用自然语言与助手交谈，无需将视线从道路上移开。与现有

6/22/2024 12:05:43 PM

清源

有望发力搜索领域，OpenAI 收购数据库分析公司 Rockset

当地时间 6 月 21 日，OpenAI 宣布完成了对数据库检索和分析公司 Rockset 的收购。公司将整合 Rockset 的技术和人员，强化各项产品的检索基础设施。OpenAI 在新闻稿中强调，AI 将有机会改变人们组织、利用自身数据的方式，这便是公司收购 Rockset 的原因。后者是一个提供“世界级”的数据索引、查询功能的实时分析数据库。据悉，Rockset 将使用户、开发人员和企业能够更好地利用自己的数据，并在使用 AI 产品和构建更智能的应用程序时访问实时信息。OpenAI 首席运营官 Brad Li

6/22/2024 9:33:34 AM

清源

OpenAI 首席技术官：GPT-5 将在一年半后发布，部分领域智能达到“博士”级别

美国达特茅斯工程学院本周四公布了对 OpenAI 首席技术官米拉・穆拉蒂的采访。穆拉蒂把 GPT-4 到 GPT-5 的飞跃描述为从高中生到博士生的成长。图源 Pexels“如果你看一下（GPT）进化的轨迹，像 GPT-3 这样的系统可能只有幼儿智力水平，而像 GPT-4 这样的系统则更像是聪明的高中生智力水平，在接下来的几年里，我们期待在特定任务上达到博士的智力水平。事情正在飞速变化、改善。”穆拉蒂强调“博士级”的智能仅适用于某些任务。“这些系统在特定任务中已经达到了人类水平（Human-level），当然，在许

6/22/2024 8:20:43 AM

清源

一手测评Claude 3.5：玩梗、看病、耍心眼、做数学题，它真比GPT-4o强吗？

机器之能报道编辑：杨文玩梗、看病、耍心眼、做数学题，「新王」Claude 3.5能力真那么玄乎？它来了，它来了，它带着 Claude 3.5 Sonnet 走来了！蛰伏三个月，就在昨晚，OpenAI 的「劲敌」Anthropic 上新了，推出新一代模型 ——Claude 3.5 Sonnet！这款大模型有啥独到之处？首先，它更能把握住细微差别、幽默和复杂指令，并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型，擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外，它在推理、阅读理解、数学、科学和

6/21/2024 6:02:00 PM

机器之能

OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5

感谢IT之家网友 VrianCao、Diixx、我抢了台的线索投递！OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemini 一样，Claude 在过去的一年里也是人气爆棚。Anthropic 由 OpenAI 前研发高管创立，赢得了谷歌、Salesforce 和亚马逊的支持。在过去的一年里，Anthropic 完成了五笔融资，总额约为 73 亿美元。今年 3 月，Anthropic 推出了

6/20/2024 11:30:35 PM

突发！Ilya Sutskever成立新公司SSI，安全超级智能是唯一目标与产品

自 5 月 15 日从 OpenAI 离职后，OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。今日凌晨，Ilya 在社媒 X 上表示自己创立了一家新公司——「安全超级智能」（Safe SuperIntelligence，SSI）。该公司的目标和产品非常明确、单一：追求安全的超级智能，希望通过一支精干顶尖的小团队取得革命性的成果，进而实现这一目标。以下是 SSI 公司的公告：超级智能已经触手可及。构建安全超级智能（SSI）是我们这个时代最重要的技术难题。我们已经启动了世界上第一个专注于S

6/20/2024 2:48:00 PM

机器之心

上海人工智能实验室发布首个 AI 高考评测结果：语数英总分最高 303 分，数学全部不及格

感谢上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍，2024 年全国高考甫一结束，该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。评测采用全国新课标 I 卷，参与评测的所有开源模型开源时间均早于高考，确保评测“闭卷”性。同时，成绩由具有高考评卷经验的教师人工评判，更加接近真实阅卷标准。该机构表示，Qwen2-72B、GPT-4o 及书生・浦语 2.0 文曲星（InternLM2-20B-WQX）成为本次大模型高考的前三甲

6/20/2024 8:33:50 AM

清源

OpenAI“宫斗”核心人物 Ilya Sutskever 出走后单飞：建立“全球首个”安全超级智能实验室

北京时间今天凌晨，原 OpenAI 公司联合创始人、首席科学家 Ilya Sutskever 在 X（推特）官宣了他正式创业的消息 —— 创办了一家名为“安全超级智能”（Safe Superintelligence，简称 SSI）的新公司，旨在创造一个“纯粹的”安全超级智能。Ilya Sutskever 表示，公司将只有一个重点、一个目标和一个产品，通过一个小型破解团队来取得“革命性”的突破，去实现追求安全超级智能的目标。同时，新公司自称是“世界上第一个”直击 SSI 的实验室。Sutskever 与 OpenAI

6/20/2024 7:18:13 AM

清源

智源更新大模型排行榜：豆包大模型“客观评测”排名国产第一

6月中旬，智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单：在有标准答案的“客观评测”中，GPT-4 以76.11分在闭源大模型中排名第一；Doubao-Pro（豆包大模型）以75.96分排名第二，同时也是得分最高的国产大模型；其后依次是 ERNIE 4.0、Baichuan3、Moonshot-v1。在开放问答等“主观评测”中，Doubao-Pro 同样排名第二，得分超过 GPT-4o 和 GPT-4。图：豆包大模型在 FlagEval 客观评测中获综合评分第二（2024年6月）FlagEval 大

6/19/2024 9:30:00 AM

新闻助手

研究称 GPT-4 通过了图灵测试，54% 的人将其误认为真人

感谢最新研究称，越来越多的人难以在图灵测试中区分 GPT-4 和人类。图源 Pexels据IT之家了解，“图灵测试”由计算机科学家艾伦・图灵在 1950 年提出，又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话，让对方误以为其是真人。加州大学圣地亚哥分校的研究人员招募了 500 名参与者，让他们与四位“对话者”进行五分钟的交流，这四位“对话者”分别是真人、上世纪 60 年代的初代聊天机器人 ELIZA、以及驱动聊天机器人 ChatGPT 的 GPT-3.5 和 GPT-4。参与者在对话结束后需判断对方是

6/17/2024 2:51:16 PM

远洋

欲成为营利性公司？OpenAI 回应：非营利组织是公司核心使命

感谢据 The Information 上周五援引知情人士消息称，OpenAI 首席执行官阿尔特曼告诉一些股东，公司正在考虑改变其治理结构，非盈利董事会将不控制营利性业务。阿尔特曼表示，董事会正在考虑的一种方案是成立一家营利性公司。报道提到，这一转变可能为 OpenAI 最终进行首次公开募股打开大门，目前 OpenAI 公司估值为 860 亿美元（IT之家备注：当前约 6257.22 亿元人民币）。阿尔特曼也有可能借此机会入股该公司，投资者正一直推动该举措。当地时间上周六，OpenAI 在回复路透社有关该报道的询问

6/17/2024 9:44:24 AM

清源

历时约半年，消息称 OpenAI 年化营收翻倍至 34 亿美元

感谢据 The Information 今日凌晨援引不具名人士消息称，OpenAI 首席执行官山姆・阿尔特曼对员工表示，在过去约六个月的时间里，公司年化营收达到了 34 亿美元（IT之家备注：当前约 246.99 亿元人民币），相比去年年底翻了一番。阿尔特曼还提到，OpenAI 通过微软 Azure 提供人工智能模型接入，也有望获得约 2 亿美元（当前约 14.53 亿元人民币）的营收。据悉，OpenAI 在 2023 年底时的年化营收还只有 16 亿美元（当前约 116.23 亿元人民币），去年夏天时约为 10

6/13/2024 8:16:39 AM

清源

GPT-4o 更容易越狱？北航 & 南洋理工上万次测试给出详细分析

GPT-4o，比上一代更容易被越狱攻击了？来自北航和南洋理工的研究人员，通过上万次的 API 查询，对 GPT-4o 各种模态的安全性进行了详细测试。结果发现，GPT-4o 新引入的语音模态带来了新的攻击面，而且多模态整体安全性不敌 GPT-4V。具体来说，研究人员针对 4 个常用的基准测试，对 GPT-4o 支持的三种模态（文本、图像、音频）进行了测试。测试一共涉及到 4000 初始文本查询的优化，8000 响应判断，16000 次 OpenAI 的 API 查询。基于此，研究人员撰写了详细的报告，给

6/12/2024 3:44:32 PM

清源

谷歌工程师批评 OpenAI，称其延缓 AGI 研究进展

TradingView 报道称，谷歌软件工程师弗朗索瓦・肖莱（François Chollet）在播客与主持人 Dwarkesh Patel 对话时，表达了他对 AGI（通用人工智能，Artificial General Intelligence）研究现状的担忧。肖莱表示，几年前所有最先进的研究成果都是公开分享和发表的，但现在情况已经不再如此。他将这一变化归因于 OpenAI 的影响，指责他们导致了“前沿研究出版的完全关闭”（complete closing down of frontier research pu

6/12/2024 3:07:56 PM

沛霖（实习）

拿下 6 亿欧元融资，“OpenAI 欧洲对手”Mistral 估值飙升至近 60 亿欧元

据《金融时报》北京时间今日凌晨报道，总部位于巴黎的 AI 初创公司 Mistral AI 现已筹集到 6 亿欧元的资金，估值接近 60 亿欧元（IT之家备注：当前约 468 亿元人民币）。该公司由微软、英伟达提供支持，成立至今刚满一年，被视作 OpenAI 的“潜在挑战者”。自（去年）12 月以来，对该公司的投资使其估值翻了三倍。Mistral 的首席执行官 Arthur Mensch 在接受采访时表示：“从创业之初，我们就被告知…… 这是一个永远不会被颠覆的市场。但我们证明事实并非如此，我们有效地颠覆了 Open

6/12/2024 2:52:36 PM

清源

消息称 OpenAI 阿尔特曼和三星李在镕首次单独会面，讨论合作 AI 芯片

感谢据《韩国时报》援引知情人士消息，OpenAI CEO 山姆・阿尔特曼近日会见了正在美国出差的三星集团会长李在镕。与此同时，OpenAI 刚刚与苹果签署了合作伙伴关系。报道称，阿尔特曼和李在镕于上周末在硅谷进行了会面，这是双方第一次单独见面。阿尔特曼曾在今年 1 月访问了韩国，并参观了三星电子的半导体工厂。报道提到，双方讨论了人工智能（AI）芯片的合作问题。阿尔特曼正在推动开发自己的 AI 芯片，以减少对英伟达的依赖。三星电子则是具有制造能力的第一大存储半导体公司，被认为是一个强大的关键合作伙伴。如果消息属实，此

6/12/2024 10:22:18 AM

汪淼

资讯热榜

OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星 ChatGPT重磅更新：新增图像库功能，可查看自己用GPT生成的所有图片本地部署DeepSeek+DiFy平台构建智能体应用 OPPO 小布助手网页版上线，接入满血版 DeepSeek OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源） OpenAI发布34页智能体实践指南：从网络搜索到代码编写别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体韩国初创公司 RLWRLD 获 1480 万美元融资，致力于机器人基础模型开发

标签云

人工智能 OpenAI AIGC AI ChatGPT DeepSeek AI绘画数据机器人谷歌模型大模型 Midjourney 智能用户学习开源 GPT 微软 Meta AI创作图像技术论文 Stable Diffusion 马斯克 Gemini 算法蛋白质生成式芯片代码英伟达腾讯神经网络计算研究 Sora AI for Science 3D Anthropic AI设计机器学习 GPU 开发者场景华为预测伟达 Transformer 百度人形机器人苹果深度学习 AI视频模态字节跳动 xAI 驾驶文本搜索大语言模型 Claude Copilot 具身智能神器推荐 LLaMA 算力安全应用视频生成科技视觉亚马逊干货合集 2024 AGI 特斯拉训练大型语言模型