理论 - AIGC宇宙

为确保训练数据公开透明，英国政府将加快制定人工智能相关规则

据《金融时报》报道，近日，英国政府文化大臣露西・弗雷泽宣布将加快制定有关人工智能透明度的规则，以帮助保护内容创作者。她表示，这些规则的出台将意味着 AI 公司必须更加公开、透明地披露训练模型所用的数据情况，用户也可以自己选择哪些数据可被 AI 公司用来训练，作品被用于训练模型的创作者也将获得报酬。图源 Pexels不仅仅是英国，欧盟当前也正在根据其人工智能法案制定类似的规则。根据该法案，AI 开发者将需要提供一份足够详细的培训内容概要，并实施相关政策，以确保自身操作符合欧盟版权法的规定。作为回应的一部分，OpenA

OpenAI 阿尔特曼谈 GPT-5：功能或类似“虚拟大脑”，将是一种特别尝试

当地时间 16 日，OpenAI 首席执行官阿尔特曼接受了硅谷风险投资公司 Redpoint 的董事兼总经理 Logan Bartlett 的专访，谈到了前不久发布的 GPT-4o 和未来将发布的 GPT-5。阿尔特曼表示，人工智能的兴起将使人们渴望人与人之间的联系，其认为在未来 12 个月内编程领域“最有前途”。当被问及 GPT-5 的更多信息时，阿尔特曼表示，待该产品发布时可能会换一种叫法，它会“很特别”—— 功能与现在的（产品）有很大不同。“比如说从 GPT-1 到 GPT-4，从叫法和功能来看都比较偏传统。

索尼音乐集团警告 AI 公司不得使用自家资产进行模型训练

感谢根据彭博社的一份新报告，索尼音乐集团正在通知各大 AI 公司不得“未经授权使用公司旗下的资产进行模型训练”。IT之家获悉，索尼音乐目前已经向 700 多家公司发送了信件，以保护其知识产权，索尼提到，任何 AI 公司未经明确许可，不得使用索尼旗下的专辑封面艺术、音乐作品和歌词等内容。在 AI 模型的训练上，版权一直是一项令人“头大”的问题，如今业界举着牌子声称“某某模型侵犯原始作者版权”的事件已经屡见不鲜，参考IT之家此前报道，今年 4 月美国众议员 Adam Schiff 提出了一项新的法案，建议 AI 公司应

GPT-4o 再秀神操作，“复现”OpenAI 总裁讲课，网友当真了

OpenAI 总裁兼联合创始人 Greg 再次大秀 GPT-4o 操作，结果网友直接缅怀 DALL-E。直接看效果。文本拼写达到惊人的一致！手部细节、光照全都有，甚至后背上的 Logo 也完全正确。有网友表示：恍惚间还以为真的是本人在讲课。也有人感叹图像生成技术发展的飞跃：Holy Cow！从完全破碎的文本到风格一致、拼写正确的写作，只用了一次迭代。GPT-4o 让网友直接缅怀 DALL-EGPT-4o 发布以来，简直就被玩儿疯了，尤其是图像生成这块。比如有网友发现，GPT-4o 在组合任意图像上面就像是打通了任督

多功能RNA分析，百度团队基于Transformer的RNA语言模型登Nature子刊

编辑 | 萝卜芯预训练语言模型在分析核苷酸序列方面显示出了良好的前景，但使用单个预训练权重集在不同任务中表现出色的多功能模型仍然存在挑战。百度大数据实验室（Big Data Lab，BDL）和上海交通大学团队开发了 RNAErnie，一种基于 Transformer 架构，以 RNA 为中心的预训练模型。研究人员用七个数据集和五个任务评估了模型，证明了 RNAErnie 在监督和无监督学习方面的优越性。RNAErnie 超越了基线，分类准确率提高了 1.8%，交互预测准确率提高了 2.2%，结构预测 F1 得分提高

iOS 版 ChatGPT 更新支持 App 首选语言设置中文

感谢据小伙伴投稿，iOS 版本 ChatGPT 今日凌晨发布 1.2024.129 版本更新，新增支持 App 首选语言设置中文，此前为其他语言。官方给出的改版本更新日志为“错误修复以及优化改进”。IT之家实测，首次启动 iOS 版 ChatGPT 会出现中文展示页，App 内支持应用语言设置，点击后将跳转至系统设置中 ChatGPT 应用设置，再次点击首选语言，即可设置软件语言。▲ ChatGPT App 首次启动页面截图▲ ChatGPT App 设置页面截图▲ ChatGPT 首选语言设置页面截图▲ Chat

OpenAI 曾秘密测试 GPT-4o，力压群雄登顶聊天机器人竞技场排行榜

OpenAI 员工 William Fedus 周一在社交平台 X 证实，近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”，正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露，GPT-4o 在测试中登顶了竞技场排行榜，取得了有史以来的最高分。“GPT-4o 是我们最先进的尖端模型，”Fedus 在推特上写道，“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”聊天机器

GPT-4o 模型登陆微软 Azure OpenAI 服务，性能更强价格更低

OpenAI 于今日凌晨发布了其最新的旗舰人工智能模型 GPT-4o。相比先前版本，GPT-4o 实现了诸多升级：速度提升一倍，价格降低 50%（百万 token 的处理成本降至 7 美元），并且支持每分钟处理高达千万 token 的数据量。该模型拥有 128K 的上下文记忆能力，知识截止时间为 2023 年 10 月。微软宣布，已通过 Azure OpenAI 服务提供 GPT-4o 的预览版本。与以往的模型不同，GPT-4o 能够无缝处理文本、图像和音频信息，为用户带来更加丰富、沉浸的交互体验。不过IT之家注意

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供

感谢OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o，该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是，GPT-4o 将免费提供给所有用户使用。综合 TechCrunch 等外媒报道，OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示，GPT-4o 将提供与 GPT-4 同等水平的智能，但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理，”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。G

李开复：中国需要自己的 ChatGPT，当下国内 AI 工具“都还不够好”

彭博社今日刊登了对李开复的专访，李开复认为中国需要自己的 ChatGPT，以加快人们对人工智能的兴趣、采用和投资。李开复谈到了“ChatGPT 时刻”—— 对于美国人来说，“ChatGPT 时刻”发生在 17 个月之前（IT之家注：2022 年 12 月，聊天机器人 ChatGPT 开始大火）。但他认为，中国用户还没有迎来“ChatGPT 时刻”，直到现在，国内的聊天机器人或工具“都还不够好”。李开复披露了自家 AI 公司零一万物的近况：已经接近盈利。在对国内外的数据集进行模型训练之后，李开复正在将自家的模型和应用

美国教授用 2 岁女儿训 AI 模型登 Science，人类幼崽头戴相机训练全新 AI

【新智元导读】为训练 AI 模型，纽约州立大学的一名教授 Brenden Lake，竟让自己不到 2 岁女儿头戴相机收集数据！要知道，Meta 训 Llama 3 直接用了 15 万亿个 token，如果 Lake 真能让 AI 模型学习人类幼崽，从有限的输入中学习，那 LLM 的全球数据荒岂不是解决了？为了训练 AI 模型，一位纽约州立大学的教授，竟然把类似 GoPro 的相机绑在了自己女儿头上！虽然听起来不可思议，但这位教授的行为，其实是有据可循的。要训练出 LLM 背后的复杂神经网络，需要海量数据。目前我们训

消息称 OpenAI 将推出多模态人工智能数字助理：可语音对话、识别物体

据 The Information 报道，OpenAI 最近向部分客户展示了一款新型多模态人工智能模型，该模型能够进行语音对话和物体识别。有消息人士透露，这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。图源 Pexels报道称，相比于 OpenAI 现有的独立图像识别和文本转语音模型，该新型模型能够更快、更准确地处理图像和音频信息。例如，它可以帮助客服人员“更好地理解来电者的语气语调，判断他们是否在使用讽刺语气”。理论上，该模型还能辅助学生学习数学知识，或翻译现实世界中的标志文字。不

【论文解读】System 2 Attention提高大语言模型客观性和事实性

一、简要介绍本文简要介绍了论文“System 2 Attention (is something you might need too) ”的相关工作。基于transformer的大语言模型（LLM）中的软注意很容易将上下文中的不相关信息合并到其潜在的表征中，这将对下一token的生成产生不利影响。为了帮助纠正这些问题，论文引入了System 2 Attention（S2A），它利用LLM的能力，用自然语言进行推理，并遵循指示，以决定要处理什么。S2A重新生成输入上下文以使输入上下文只包含相关部分，然后再处理重新

在富岳超算上训练大模型，日本联合研究团队发布 Fugaku-LLM

由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。Fugaku-LLM 模型的开发于 2023 年 5 月启动，初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所（理研）。而在 2023 年 8 月，另外三家合作方 —— 名古屋大学、CyberAgent（也是游戏企业 Cygames 的母公司）和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。▲ 富岳超

准确率 98%，OpenAI 推出专用 AI 工具：能识别 DALL・E 3 生成的图片

感谢OpenAI 公司今天发布新闻稿，宣布推出专用的 AI 检测工具，能够识别某张图片是否由 DALL・E 3 模型生成，且准确率高达 98%。OpenAI 公司在博文中表示，之所以推出这项新工具，主要是为了帮助研究人员研究内容真实性，此外该公司还宣布加入 C2PA（内容来源和真实性联盟）的指导委员会。C2PA 是一种广泛使用的数字内容认证标准，由包括软件公司、相机制造商和在线平台在内的众多参与者开发和采用，C2PA 可用于证明内容来自特定来源。OpenAI 表示自今年早些时候，在 ChatGPT 和 OpenAI

91.1% 准确率，性能远超 GPT-4 系列模型，谷歌推出多模态医学大模型 Med-Gemini

编辑 | 萝卜皮各种复杂的医疗应用给人工智能带来了巨大挑战：需要先进的推理、获取最新的医学知识以及对复杂的多模态数据的理解。Gemini 模型在多模态和长上下文推理方面具有强大的通用能力，为 AI 在医学领域应用提供了可能性。基于 Gemini 的核心优势，谷歌的研究人员推出了 Med-Gemini，这是一个功能强大的多模态模型系列，专门用于医学，能够无缝使用网络搜索，并且可以使用自定义编码器有效地针对新颖的模态进行定制。研究人员用 14 项医疗基准评估 Med-Gemini，在其中 10 项上建立了新的最先进（S

程序员问答平台 Stack Overflow 宣布与 OpenAI 建立 API 合作伙伴关系

感谢程序员问答平台 Stack Overflow 与 OpenAI 今天宣布建立新的 API 合作伙伴关系。OpenAI 和 Stack Overflow 将通过 OverflowAPI 为 OpenAI 用户提供所需的准确、经过审核的数据基础，以便 AI 工具快速找到问题解决方案，令技术人员能够专注于高优先级的任务；OpenAI 还将在 ChatGPT 中直接显示来自 Stack Overflow 的经过验证的技术知识和代码。作为合作的一部分：OpenAI 将使用 Stack Overflow 的 Overflo

Chrome 浏览器桌面版地址栏整合自家聊天机器人：@Gemini 即可召唤

谷歌 Chrome 浏览器今日早些时候在 X（推特）宣布，其桌面版地址栏现已整合 Gemini 聊天机器人，用户可以通过简单、便捷的方式将 Gemini 召唤出来：在地址栏中输入“@”，然后选择“与 Gemini 聊天”，输入自定的提示词即可获取 Gemini 的回复。不久之前，该功能仍在 Canary 版本中进行测试。经IT之家此次实测，当 Chrome 更新至 124.0.6367.119（正式版本）之后，即可体验。Gemini 是谷歌 Deepmind 最新、最强大的 AI 模型。它原生支持多模态，具备跨模态