应用

刚刚,OpenAI安全副总裁、北大校友Lilian Weng宣布离职,有时间写博客了

翁荔的技术博客深入、细致,具有前瞻性,被很多 AI 研究者视为重要的参考资料。 如今,她离开了 OpenAI,开启新的征程。 而且她表示,之后可能有更多时间频繁更新博客。

类Sora模型到底懂不懂物理?字节完成系统性实验,图灵奖得主杨立昆赞转!

Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。 近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,但暂时还无法真正理解物理规律,做到“举一反三”。 图灵奖得主、Meta首席AI科学家杨立昆点赞并转发了该研究,表示“结论不令人意外,但很高兴终于有人做了这个尝试!

GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务

OpenAI 出了个新功能,直接让 ChatGPT 输出的速度原地起飞!这个功能叫做“预测输出”(Predicted Outputs),在它的加持之下,GPT-4o 可以比原先快至多 5 倍。

ChatGPT AI 搜索还不是“谷歌杀手”:关键字搜索不靠谱

11 月 5 日消息,OpenAI 上周正式发布了备受瞩目的搜索产品 ChatGPT Search,向谷歌发起了直接挑战。 这一时刻的到来,其实早已在业界的预料之中,因此谷歌在今年早些时候便将人工智能生成的答案融入其核心产品之中,但在此过程中却出现了一些令人尴尬的“幻觉”。 这个失误让不少人认为,OpenAI 的搜索引擎将会成为真正的“谷歌杀手”。

OpenAI也要做消费类硬件了?Meta前AR眼镜负责人加盟

OpenAI 不仅专注于软件,还要深入硬件研究。 Meta 增强现实眼镜项目前负责人 Caitlin Kalinowski 宣布,她将加入 OpenAI,领导机器人和消费类硬件业务。 刚刚,Kalinowski 在领英上写道:「非常高兴地告诉大家我将加入 OpenAI,领导机器人和消费类硬件业务!

前 OpenAI “AGI 准备工作”负责人:AI 将很快完成人类在计算机上能做的一切

据《商业内幕(Business Insider)》当地时间 3 日报道,OpenAI 前政策研究与“AGI (AI在线注:通用人工智能)准备工作”负责人 Miles Brundage 表示,未来几年行业可能会开发出“几乎能够远程完成”人类能通过计算机操作的所有任务的系统,包括使用鼠标和键盘,甚至在视频聊天中呈现出“人类形象”。 对于 OpenAI 等公司来说,开发具备 AGI 的机器的时间表是业内广泛关注的热点话题。 一些领域中的重要人物相信,这项技术将在未来数年内到来。

创新能力超越AI Scientist,上海AI Lab「AI 科研团队」VirSci来了

编辑 | ScienceAI由上海人工智能实验室提出的 VirSci(Virtual Scientists)系统是一个基于大语言模型(LLM)的多智能体协作平台,专注于模拟科学家团队的合作过程,从而加速科研创新。 不同于以往的单智能体系统,VirSci 通过使用真实科学家的数据来模拟科学团队的多人协作,不仅可以通过团队成员的合作讨论来生成更具创新性和影响力的科研想法,还展现出作为「科学学」(Scienceof Science)研究工具的巨大潜力。 该研究以「Two Heads Are Better Than One: A Multi-Agent System Has the Potential to Improve Scientific Idea Generation」为题,于 2024 年 10 月 12 日发布在 arXiv  预印平台。

研究人员绕过 GPT-4o 模型安全护栏,利用“十六进制字符串”成功令其编写漏洞攻击程序

网络安全公司 0Din 的研究员 Marco Figueroa 发现了一种新型 GPT 越狱攻击手法,成功突破了 GPT-4o 内置的“安全护栏”措施,能够使其编写出恶意攻击程序。 参考 OpenAI 介绍,ChatGPT-4o 内置了一系列“安全护栏”措施,以防止该 AI 遭到用户不当使用,相关防护措施会分析输入的提示文本,判断用户是否要求模型生成恶意内容。 ▲ 图源 Marco Figueroa 博客(下同)不过 Marco Figueroa 尝试设计了一种将恶意指令转化为十六进制的越狱方法,号称能够绕过 GPT-4o 的防护,让 GPT-4o 解码运行用户的恶意指令。

GPT-5 要等到明年?OpenAI CEO:今年无法同时发布那么多东西

美国时间周四,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)透露,该公司的下一个大型人工智能模型可能不会在今年面世,原因是其正“优先开发”当前专注于推理与难题解决的模型。 在参与 Reddit 网站的网友问答活动时,奥特曼指出:“所有模型都变得越来越复杂,我们无法像我们希望的那样同时发布那么多东西。 ”他还解释称,在为“众多卓越创意”分配计算资源时,公司面临着“诸多限制和艰难抉择”。

提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。

支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级

中国电信人工智能研究院(TeleAI)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。 时隔不到半年,TeleAI 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别。 与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。

奥特曼回答一切:Ilya确实看到了了不起的东西,OpenAI也缺算力

北京时间 11 月 1 日凌晨,OpenAI 宣布为 ChatGPT 推出了最新的人工智能搜索体验。 在宣布发布 ChatGPT 搜索后不久,OpenAI 还在 Reddit 上进行了 AMA 问答。 在问到 Ilya 到底看到了什么时?

豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍

强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。 近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。 这是一个灵活高效的 RL/RLHF 框架,可显著提升训练吞吐量,降低开发和维护复杂度。

继 ChatGPT 后,Anthropic 旗下 Claude AI 推出桌面平台客户端

继 ChatGPT 后,目前又有一款海外流行的人工智能 Claude AI 获得了桌面版客户端,目前相关客户端处于测试状态,支持 Windows / macOS / iOS 平台。 开发商 Anthropic 在 X 平台官宣了这一消息,同时透露用户可以使用热键快速唤起客户端界面,不过 Claude AI 客户端定位 AI 搜索引擎,与 OpenAI 的 ChatGPT 客户端聊天有所差异。 参考应用详情页,这一 AI 客户端主打语音搜索,不过用户也可以令其写作文章邮件、解决数学问题、判断语法错误、分析文档内容等。

OpenAI 正面对抗谷歌、Perplexity,ChatGPT 搜索功能今日上线

感谢北京时间今日凌晨,OpenAI 宣布在其大模型产品 ChatGPT 中新增了搜索功能,正式进军由 Alphabet 旗下 Google 长期主导的搜索领域,同时也与微软的必应和新兴搜索型 AI 聊天机器人服务 Perplexity 形成竞争。 OpenAI 表示,ChatGPT 搜索功能会根据用户的需求自动决定是否检索网络,能够快速提供最新信息,并附上相关的网页链接。 官方博客表示,ChatGPT 搜索功能利用第三方搜索供应商的技术,并整合合作伙伴直接提供的内容,来满足用户的信息需求。

独家丨字节招兵买马,拟在欧洲设立AI研发中心

知情人士透露,字节跳动目前已经开始寻找欧洲的 LLM 和 AI 方面技术大牛,积极招揽人才。 而纵观欧洲各国的 AI 技术水平,瑞士、英国和法国相对靠前。 其中,瑞士和英国都有不少知名院校。

谷歌:Gemini API 用量 6 个月飙升 14 倍,明年将升级 AI 助手

科技媒体 The Decoder 昨日(10 月 30 日)发布博文,报道称谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在最新季度财报电话会议上,宣布 Gemini API 用量在过去 6 个月内飙升了 14 倍。 皮查伊表示谷歌已经在 Google Maps、Google Search 等核心业务中整合 Gemini,目前已初步覆盖 20 亿用户,此外独立 Gemini 应用和嵌入的 Android Assistant 也见证了强劲的用户增长。 谷歌的云计算部门已经开始受益于人工智能的繁荣,收入增长了 35%,达到 114 亿美元,这包括人工智能和第三方服务,该部门的营业收入从去年的 2.7 亿美元增长到了 19.5 亿美元。

Python 成 GitHub 最受欢迎编程语言,AI 成主要推动力

GitHub 年度报告《Octoverse》显示,Python 首次超越 JavaScript 成为 GitHub 上最受欢迎的编程语言。 这主要是受到人工智能(AI)开发需求激增的推动,Python 还被广泛应用于数据科学和开源项目的开发。 报告指出,与生成式 AI 相关的项目贡献量在过去一年中增长了 59%,AI 相关的公共项目的贡献量几乎比 2023 年翻了一番,印度、德国、日本和新加坡是这些贡献的主要来源。