模型 - AIGC宇宙

OpenAI 曾秘密测试 GPT-4o，力压群雄登顶聊天机器人竞技场排行榜

OpenAI 员工 William Fedus 周一在社交平台 X 证实，近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”，正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露，GPT-4o 在测试中登顶了竞技场排行榜，取得了有史以来的最高分。“GPT-4o 是我们最先进的尖端模型，”Fedus 在推特上写道，“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”聊天机器

GPT-4o 模型登陆微软 Azure OpenAI 服务，性能更强价格更低

OpenAI 于今日凌晨发布了其最新的旗舰人工智能模型 GPT-4o。相比先前版本，GPT-4o 实现了诸多升级：速度提升一倍，价格降低 50%（百万 token 的处理成本降至 7 美元），并且支持每分钟处理高达千万 token 的数据量。该模型拥有 128K 的上下文记忆能力，知识截止时间为 2023 年 10 月。微软宣布，已通过 Azure OpenAI 服务提供 GPT-4o 的预览版本。与以往的模型不同，GPT-4o 能够无缝处理文本、图像和音频信息，为用户带来更加丰富、沉浸的交互体验。不过IT之家注意

OpenAI 发布全新旗舰生成式 AI 模型 GPT-4o：语音对话更流畅，免费提供

感谢OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o，该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。最让人惊喜的是，GPT-4o 将免费提供给所有用户使用。综合 TechCrunch 等外媒报道，OpenAI 首席技术官穆里・穆拉蒂 (Muri Murati) 表示，GPT-4o 将提供与 GPT-4 同等水平的智能，但在文本、图像以及语音处理方面均取得了进一步提升。“GPT-4o 可以综合利用语音、文本和视觉信息进行推理，”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。G

李开复：中国需要自己的 ChatGPT，当下国内 AI 工具“都还不够好”

彭博社今日刊登了对李开复的专访，李开复认为中国需要自己的 ChatGPT，以加快人们对人工智能的兴趣、采用和投资。李开复谈到了“ChatGPT 时刻”—— 对于美国人来说，“ChatGPT 时刻”发生在 17 个月之前（IT之家注：2022 年 12 月，聊天机器人 ChatGPT 开始大火）。但他认为，中国用户还没有迎来“ChatGPT 时刻”，直到现在，国内的聊天机器人或工具“都还不够好”。李开复披露了自家 AI 公司零一万物的近况：已经接近盈利。在对国内外的数据集进行模型训练之后，李开复正在将自家的模型和应用

美国教授用 2 岁女儿训 AI 模型登 Science，人类幼崽头戴相机训练全新 AI

【新智元导读】为训练 AI 模型，纽约州立大学的一名教授 Brenden Lake，竟让自己不到 2 岁女儿头戴相机收集数据！要知道，Meta 训 Llama 3 直接用了 15 万亿个 token，如果 Lake 真能让 AI 模型学习人类幼崽，从有限的输入中学习，那 LLM 的全球数据荒岂不是解决了？为了训练 AI 模型，一位纽约州立大学的教授，竟然把类似 GoPro 的相机绑在了自己女儿头上！虽然听起来不可思议，但这位教授的行为，其实是有据可循的。要训练出 LLM 背后的复杂神经网络，需要海量数据。目前我们训

消息称 OpenAI 将推出多模态人工智能数字助理：可语音对话、识别物体

据 The Information 报道，OpenAI 最近向部分客户展示了一款新型多模态人工智能模型，该模型能够进行语音对话和物体识别。有消息人士透露，这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。图源 Pexels报道称，相比于 OpenAI 现有的独立图像识别和文本转语音模型，该新型模型能够更快、更准确地处理图像和音频信息。例如，它可以帮助客服人员“更好地理解来电者的语气语调，判断他们是否在使用讽刺语气”。理论上，该模型还能辅助学生学习数学知识，或翻译现实世界中的标志文字。不

在富岳超算上训练大模型，日本联合研究团队发布 Fugaku-LLM

由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。Fugaku-LLM 模型的开发于 2023 年 5 月启动，初期参与方包括富岳超算所有者富士通、东京工业大学、日本东北大学和日本理化学研究所（理研）。而在 2023 年 8 月，另外三家合作方 —— 名古屋大学、CyberAgent（也是游戏企业 Cygames 的母公司）和 HPC-AI 领域创企 Kotoba Technologies 也加入了该模型研发计划。▲ 富岳超

程序员问答平台 Stack Overflow 宣布与 OpenAI 建立 API 合作伙伴关系

感谢程序员问答平台 Stack Overflow 与 OpenAI 今天宣布建立新的 API 合作伙伴关系。OpenAI 和 Stack Overflow 将通过 OverflowAPI 为 OpenAI 用户提供所需的准确、经过审核的数据基础，以便 AI 工具快速找到问题解决方案，令技术人员能够专注于高优先级的任务；OpenAI 还将在 ChatGPT 中直接显示来自 Stack Overflow 的经过验证的技术知识和代码。作为合作的一部分：OpenAI 将使用 Stack Overflow 的 Overflo

Chrome 浏览器桌面版地址栏整合自家聊天机器人：@Gemini 即可召唤

谷歌 Chrome 浏览器今日早些时候在 X（推特）宣布，其桌面版地址栏现已整合 Gemini 聊天机器人，用户可以通过简单、便捷的方式将 Gemini 召唤出来：在地址栏中输入“@”，然后选择“与 Gemini 聊天”，输入自定的提示词即可获取 Gemini 的回复。不久之前，该功能仍在 Canary 版本中进行测试。经IT之家此次实测，当 Chrome 更新至 124.0.6367.119（正式版本）之后，即可体验。Gemini 是谷歌 Deepmind 最新、最强大的 AI 模型。它原生支持多模态，具备跨模态

苹果发布 OpenELM，基于开源训练和推理框架的高效语言模型

在 WWDC24 之前，苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”，名为 OpenELM。当然，这是一项开源语言模型，其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下：大型语言模型的可重复性和透明性对于推进开放研究、确保结果的可信度以及调查数据和模型偏差以及潜在风险至关重要。为此，我们发布了 OpenELM，一个最先进的开源语言模型。OpenELM 使用分层缩放策略，可以有效地分配 Transformer 模型每一层的参数

13 项测试仅通过 4 项，Meta 的 Llama 2 LLM 被指安全性低：幻觉率 48%

AI 安全公司 DeepKeep 近日发布评估报告，在 13 个风险评估类别中，Meta 公司的 Llama 2 大语言模型仅通过 4 项测试。报告称 70 亿参数的 Llama 2 7B 模型幻觉（回答内容存在虚假，或者有误导性内容）最为严重，幻觉率高达 48%。DeepKeep 表示：“结果表明，模型有明显的幻觉倾向，提供正确答案或编造回答的可能性对半开，而幻觉率最高，那么向用户传递的错误信息越多”。除了幻觉问题之外，Llama 2 大语言模型还存在注入和操纵等问题。根据测试结果，80% 的场景下通过“提示注入

Chrome 浏览器桌面版地址栏即将整合聊天机器人 Gemini

感谢桌面 Chrome 浏览器地址栏即将添加 Gemini 快捷方式，用户在 Gemini 网页上登录账户后，用户只需输入 @gemini 即可快速与谷歌的人工智能聊天机器人 Gemini 开始聊天。该功能目前正在 Chrome 浏览器 Canary 测试版中进行测试，地址栏下拉菜单底部会出现提醒，“输入 @gemini 与 Gemini 聊天”。目前该功能仅适用于 Chrome 浏览器 Canary 125 版本，需要启用两个标志（Flags）才能开启，IT之家汇总如下：chrome://flags/#omnib

从AIGC到AGI，为什么我们需要更多的“技术信仰派”？

整理 | 伊风采访 | 张晓楠嘉宾 | 巴川、朱雷、肖然作为AIGC应用落地元年，2024开年就抛给我们一些不太好回答的问题：在以探索AGI为长期目标时，我们该坚守技术信仰吗？除了复制国外GPT-4、Sora这样的成功案例，我们该如何寻求更大发展和突破？即便算力问题得以解决，算法的难题如何跨越？国内企业为什么大都部署多个大模型？为什么并非所有企业都该拥抱AIGC？前不久51CTO全新直播栏目《AIGC实战派》有幸邀请到竞技世界首席数据科学家巴川，元语智能联合创始人兼COO、SuperCLUE社区发起人朱雷以及Tho

融合 ChatGPT+DALL・E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

在开源社区中把 GPT-4 Dall・E 3 能⼒整合起来的模型该有多强？香港中文大学终身教授贾佳亚团队提出多模态模型 Mini-Gemini：更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力，还能结合图像推理和生成，堪称王炸。Mini-Gemini 还提供了 2B 小杯到 34B 的超大杯，最强模型在多个指标上相比谷歌的 Gemini Pro 甚至 GPT-4V 都不遑多让。目前，Mini-Gemini 从代码、模型到数据已全部开源，登上了 PaperWithCode 热榜。Mini-Gemini

OpenAI 在东京开设亚洲首个办事处，将发布日语优化型 GPT-4 模型

感谢OpenAI 今日通过官方博客页面宣布，公司在亚洲的首个办事处落户日本东京，将业务扩展到亚洲。OpenAI 表示将致力于与当地政府、企业和研究机构合作，开发安全的人工智能工具，满足当地的独特需求。OpenAI 还将发布针对日语进行优化的 GPT-4 定制模型。与 GPT-4 Turbo 相比，它在日文文本方面的性能有所提高，运行速度最多可提高三倍。与此同时，该模型提高了翻译和总结日语文本的性能和成本效益。在当地最常用的英语学习 App“Speak”即采用了 OpenAI 提供的技术，在用户练习出错时讲解的速度提

Arm CEO 示警：美国未来 20%-25% 的电量将被 AI 数据中心消耗

感谢当地时间周二，Arm 公司 CEO 雷内・哈斯（Rene Haas）发出了严厉的警告，他表示人工智能收集的信息越多，他们就越聪明，但他们收集的信息越多，需要的力量就越大。包括 OpenAI 的 ChatGPT 在内的 AI 模型需要大量电力，这可能导致到 2030 年，AI 数据中心将消耗美国 20% 至 25% 的电力需求，相比今天的 4% 大幅增加。他特别强调，类似 ChatGPT 这样的大语言模型耗电非常严重，这些模型需要“永不满足”的电力才能有效运行。据IT之家此前报道，ChatGPT 每天需要处理超过

对标 GPT-4，消息称 Meta 最快下周发布两款 Llama 3 模型

感谢科技媒体 theinformation 近日发布博文，表示 Meta 公司将于下周预告两款 Llama 3 AI 模型，为今年夏季推出“完整形态” Llama 3 铺垫。Meta 公司本周二在伦敦举办的一场活动中，确认会在下个月之前发布 Llama 3 相关模型。IT之家翻译 Meta 公司全球事务总裁尼克・克莱格（Nick Clegg）采访内容如下：我希望下个月或者更短时间内，能够推出下一代 Llama 3。我们计划今年推出一系列具有不同功能、不同通用性的模型。Meta 首席产品官 Chris Cox 补充说

融合视觉能力，OpenAI 向开发人员提供 GPT-4 Turbo with Vision

感谢OpenAI 宣布，具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。据IT之家了解，该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库，最大的革新之处在于其新增的视觉理解能力。在过去，开发者需要调用不同的模型来处理文本和图像信息，而 GPT-4 Turbo with Vision 则将两者合二为一，极大简化了开发流程，并带来了广泛的应