chatgpt
研究发现,OpenAI 的 GPT-4o 道德推理能力胜过人类专家
近期的一项研究表明,OpenAI 最新的聊天机器人 GPT-4o 能够提供道德方面的解释和建议,且质量优于“公认的”道德专家所提供的建议。据 The Decoder 当地时间周六报道,美国北卡罗莱纳大学教堂山分校和艾伦 AI 研究所的研究人员进行了两项研究,将 GPT 模型与人类的道德推理能力进行比较,以探讨大语言模型是否可被视为“道德专家”。IT之家汇总研究内容如下:研究一501 名美国成年人对比了 GPT-3.5-turbo 模型和其他人类参与者的道德解释。结果表明,人们认为 GPT 的解释比人类参与者的解释更
斯坦福大模型评测榜 Claude 3 排名第一,阿里 Qwen2、零一万物 Yi Large 国产模型进入前十
斯坦福大学基础模型研究中心(CRFM)6 月 11 日发布了大规模多任务语言理解能力评估(Massive Multitask Language Understanding on HELM)排行榜,其中综合排名前十的大语言模型中有两款来自中国厂商,分别是阿里巴巴的 Qwen2 Instruct(72B)和零一万物的 Yi Large(Preview)。据悉大规模多任务语言理解能力评估(MMLU on HELM)采用了 Dan Hendrycks 等人提出的一种测试方法,用于衡量文本模型在多任务学习中的准确性。这个测试
生成式 AI“上车”,大众高尔夫、途观、帕萨特等海外版车型现已支持 ChatGPT
当地时间 21 日,大众汽车宣布配备新一代信息娱乐系统的车型现已加入对 ChatGPT 的支持。在欧洲地区,引入 ChatGPT 的车型包括纯电动 ID.系列、新款高尔夫、新款途观、新款帕萨特,用户可通过车辆内置 IDA 语音助手访问 ChatGPT。据介绍,AI“上车”之后带来的体验远远超出以往,用户可以要求汽车直接读出搜索结果,或使用自然语言与汽车进行交互。例如,接入 ChatGPT 的车机可以提供旅游景点信息、报道过去的足球比赛或帮助解决数学问题。驾驶员只需用自然语言与助手交谈,无需将视线从道路上移开。与现有
有望发力搜索领域,OpenAI 收购数据库分析公司 Rockset
当地时间 6 月 21 日,OpenAI 宣布完成了对数据库检索和分析公司 Rockset 的收购。公司将整合 Rockset 的技术和人员,强化各项产品的检索基础设施。OpenAI 在新闻稿中强调,AI 将有机会改变人们组织、利用自身数据的方式,这便是公司收购 Rockset 的原因。后者是一个提供“世界级”的数据索引、查询功能的实时分析数据库。据悉,Rockset 将使用户、开发人员和企业能够更好地利用自己的数据,并在使用 AI 产品和构建更智能的应用程序时访问实时信息。OpenAI 首席运营官 Brad Li
OpenAI 首席技术官:GPT-5 将在一年半后发布,部分领域智能达到“博士”级别
美国达特茅斯工程学院本周四公布了对 OpenAI 首席技术官米拉・穆拉蒂的采访。穆拉蒂把 GPT-4 到 GPT-5 的飞跃描述为从高中生到博士生的成长。图源 Pexels“如果你看一下(GPT)进化的轨迹,像 GPT-3 这样的系统可能只有幼儿智力水平,而像 GPT-4 这样的系统则更像是聪明的高中生智力水平,在接下来的几年里,我们期待在特定任务上达到博士的智力水平。事情正在飞速变化、改善。”穆拉蒂强调“博士级”的智能仅适用于某些任务。“这些系统在特定任务中已经达到了人类水平(Human-level),当然,在许
一手测评Claude 3.5:玩梗、看病、耍心眼 、做数学题,它真比GPT-4o强吗?
机器之能报道编辑:杨文玩梗、看病、耍心眼、做数学题,「新王」Claude 3.5能力真那么玄乎?它来了,它来了,它带着 Claude 3.5 Sonnet 走来了!蛰伏三个月,就在昨晚,OpenAI 的「劲敌」Anthropic 上新了,推出新一代模型 ——Claude 3.5 Sonnet!这款大模型有啥独到之处?首先,它更能把握住细微差别、幽默和复杂指令,并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型,擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外,它在推理、阅读理解、数学、科学和
OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5
感谢IT之家网友 VrianCao、Diixx、我抢了台 的线索投递!OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemini 一样,Claude 在过去的一年里也是人气爆棚。Anthropic 由 OpenAI 前研发高管创立,赢得了谷歌、Salesforce 和亚马逊的支持。在过去的一年里,Anthropic 完成了五笔融资,总额约为 73 亿美元。今年 3 月,Anthropic 推出了
突发!Ilya Sutskever成立新公司SSI,安全超级智能是唯一目标与产品
自 5 月 15 日从 OpenAI 离职后,OpenAI 前首席科学家 Ilya Sutskever 官宣了自己的新动向。今日凌晨,Ilya 在社媒 X 上表示自己创立了一家新公司——「安全超级智能」(Safe SuperIntelligence,SSI)。该公司的目标和产品非常明确、单一:追求安全的超级智能,希望通过一支精干顶尖的小团队取得革命性的成果,进而实现这一目标。以下是 SSI 公司的公告:超级智能已经触手可及。构建安全超级智能(SSI)是我们这个时代最重要的技术难题。我们已经启动了世界上第一个专注于S
上海人工智能实验室发布首个 AI 高考评测结果:语数英总分最高 303 分,数学全部不及格
感谢上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍,2024 年全国高考甫一结束,该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。评测采用全国新课标 I 卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评卷经验的教师人工评判,更加接近真实阅卷标准。该机构表示,Qwen2-72B、GPT-4o 及书生・浦语 2.0 文曲星(InternLM2-20B-WQX)成为本次大模型高考的前三甲
OpenAI“宫斗”核心人物 Ilya Sutskever 出走后单飞:建立“全球首个”安全超级智能实验室
北京时间今天凌晨,原 OpenAI 公司联合创始人、首席科学家 Ilya Sutskever 在 X(推特)官宣了他正式创业的消息 —— 创办了一家名为“安全超级智能”(Safe Superintelligence,简称 SSI)的新公司,旨在创造一个“纯粹的”安全超级智能。Ilya Sutskever 表示,公司将只有一个重点、一个目标和一个产品,通过一个小型破解团队来取得“革命性”的突破,去实现追求安全超级智能的目标。同时,新公司自称是“世界上第一个”直击 SSI 的实验室。Sutskever 与 OpenAI
智源更新大模型排行榜:豆包大模型“客观评测”排名国产第一
6月中旬,智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单:在有标准答案的“客观评测”中,GPT-4 以76.11分在闭源大模型中排名第一;Doubao-Pro(豆包大模型)以75.96分排名第二,同时也是得分最高的国产大模型;其后依次是 ERNIE 4.0、Baichuan3、Moonshot-v1。在开放问答等“主观评测”中,Doubao-Pro 同样排名第二,得分超过 GPT-4o 和 GPT-4。图:豆包大模型在 FlagEval 客观评测中获综合评分第二(2024年6月)FlagEval 大
研究称 GPT-4 通过了图灵测试,54% 的人将其误认为真人
感谢最新研究称,越来越多的人难以在图灵测试中区分 GPT-4 和人类。图源 Pexels据IT之家了解,“图灵测试”由计算机科学家艾伦・图灵在 1950 年提出,又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话,让对方误以为其是真人。加州大学圣地亚哥分校的研究人员招募了 500 名参与者,让他们与四位“对话者”进行五分钟的交流,这四位“对话者”分别是真人、上世纪 60 年代的初代聊天机器人 ELIZA、以及驱动聊天机器人 ChatGPT 的 GPT-3.5 和 GPT-4。参与者在对话结束后需判断对方是
欲成为营利性公司?OpenAI 回应:非营利组织是公司核心使命
感谢据 The Information 上周五援引知情人士消息称,OpenAI 首席执行官阿尔特曼告诉一些股东,公司正在考虑改变其治理结构,非盈利董事会将不控制营利性业务。阿尔特曼表示,董事会正在考虑的一种方案是成立一家营利性公司。报道提到,这一转变可能为 OpenAI 最终进行首次公开募股打开大门,目前 OpenAI 公司估值为 860 亿美元(IT之家备注:当前约 6257.22 亿元人民币)。阿尔特曼也有可能借此机会入股该公司,投资者正一直推动该举措。当地时间上周六,OpenAI 在回复路透社有关该报道的询问
历时约半年,消息称 OpenAI 年化营收翻倍至 34 亿美元
感谢据 The Information 今日凌晨援引不具名人士消息称,OpenAI 首席执行官山姆・阿尔特曼对员工表示,在过去约六个月的时间里,公司年化营收达到了 34 亿美元(IT之家备注:当前约 246.99 亿元人民币),相比去年年底翻了一番。阿尔特曼还提到,OpenAI 通过微软 Azure 提供人工智能模型接入,也有望获得约 2 亿美元(当前约 14.53 亿元人民币)的营收。据悉,OpenAI 在 2023 年底时的年化营收还只有 16 亿美元(当前约 116.23 亿元人民币),去年夏天时约为 10
GPT-4o 更容易越狱?北航 & 南洋理工上万次测试给出详细分析
GPT-4o,比上一代更容易被越狱攻击了?来自北航和南洋理工的研究人员,通过上万次的 API 查询,对 GPT-4o 各种模态的安全性进行了详细测试。结果发现,GPT-4o 新引入的语音模态带来了新的攻击面,而且多模态整体安全性不敌 GPT-4V。具体来说,研究人员针对 4 个常用的基准测试,对 GPT-4o 支持的三种模态(文本、图像、音频)进行了测试。测试一共涉及到 4000 初始文本查询的优化,8000 响应判断,16000 次 OpenAI 的 API 查询。基于此,研究人员撰写了详细的报告,给
谷歌工程师批评 OpenAI,称其延缓 AGI 研究进展
TradingView 报道称,谷歌软件工程师弗朗索瓦・肖莱(François Chollet)在播客与主持人 Dwarkesh Patel 对话时,表达了他对 AGI(通用人工智能,Artificial General Intelligence)研究现状的担忧。肖莱表示,几年前所有最先进的研究成果都是公开分享和发表的,但现在情况已经不再如此。他将这一变化归因于 OpenAI 的影响,指责他们导致了“前沿研究出版的完全关闭”(complete closing down of frontier research pu
拿下 6 亿欧元融资,“OpenAI 欧洲对手”Mistral 估值飙升至近 60 亿欧元
据《金融时报》北京时间今日凌晨报道,总部位于巴黎的 AI 初创公司 Mistral AI 现已筹集到 6 亿欧元的资金,估值接近 60 亿欧元(IT之家备注:当前约 468 亿元人民币)。该公司由微软、英伟达提供支持,成立至今刚满一年,被视作 OpenAI 的“潜在挑战者”。自(去年)12 月以来,对该公司的投资使其估值翻了三倍。Mistral 的首席执行官 Arthur Mensch 在接受采访时表示:“从创业之初,我们就被告知…… 这是一个永远不会被颠覆的市场。但我们证明事实并非如此,我们有效地颠覆了 Open
消息称 OpenAI 阿尔特曼和三星李在镕首次单独会面,讨论合作 AI 芯片
感谢据《韩国时报》援引知情人士消息,OpenAI CEO 山姆・阿尔特曼近日会见了正在美国出差的三星集团会长李在镕。与此同时,OpenAI 刚刚与苹果签署了合作伙伴关系。报道称,阿尔特曼和李在镕于上周末在硅谷进行了会面,这是双方第一次单独见面。阿尔特曼曾在今年 1 月访问了韩国,并参观了三星电子的半导体工厂。报道提到,双方讨论了人工智能(AI)芯片的合作问题。阿尔特曼正在推动开发自己的 AI 芯片,以减少对英伟达的依赖。三星电子则是具有制造能力的第一大存储半导体公司,被认为是一个强大的关键合作伙伴。如果消息属实,此