应用
GPT-5 要等到明年?OpenAI CEO:今年无法同时发布那么多东西
美国时间周四,OpenAI 首席执行官萨姆・奥特曼(Sam Altman)透露,该公司的下一个大型人工智能模型可能不会在今年面世,原因是其正“优先开发”当前专注于推理与难题解决的模型。 在参与 Reddit 网站的网友问答活动时,奥特曼指出:“所有模型都变得越来越复杂,我们无法像我们希望的那样同时发布那么多东西。 ”他还解释称,在为“众多卓越创意”分配计算资源时,公司面临着“诸多限制和艰难抉择”。
11/3/2024 11:19:28 PM
小小
提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。
11/3/2024 3:24:59 PM
沛霖(实习)
支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级
中国电信人工智能研究院(TeleAI)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。 时隔不到半年,TeleAI 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别。 与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。
11/3/2024 9:37:53 AM
沛霖(实习)
奥特曼回答一切:Ilya确实看到了了不起的东西,OpenAI也缺算力
北京时间 11 月 1 日凌晨,OpenAI 宣布为 ChatGPT 推出了最新的人工智能搜索体验。 在宣布发布 ChatGPT 搜索后不久,OpenAI 还在 Reddit 上进行了 AMA 问答。 在问到 Ilya 到底看到了什么时?
11/1/2024 4:56:00 PM
机器之心
豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。 近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。 这是一个灵活高效的 RL/RLHF 框架,可显著提升训练吞吐量,降低开发和维护复杂度。
11/1/2024 2:44:00 PM
新闻助手
继 ChatGPT 后,Anthropic 旗下 Claude AI 推出桌面平台客户端
继 ChatGPT 后,目前又有一款海外流行的人工智能 Claude AI 获得了桌面版客户端,目前相关客户端处于测试状态,支持 Windows / macOS / iOS 平台。 开发商 Anthropic 在 X 平台官宣了这一消息,同时透露用户可以使用热键快速唤起客户端界面,不过 Claude AI 客户端定位 AI 搜索引擎,与 OpenAI 的 ChatGPT 客户端聊天有所差异。 参考应用详情页,这一 AI 客户端主打语音搜索,不过用户也可以令其写作文章邮件、解决数学问题、判断语法错误、分析文档内容等。
11/1/2024 7:34:03 AM
漾仔
OpenAI 正面对抗谷歌、Perplexity,ChatGPT 搜索功能今日上线
感谢北京时间今日凌晨,OpenAI 宣布在其大模型产品 ChatGPT 中新增了搜索功能,正式进军由 Alphabet 旗下 Google 长期主导的搜索领域,同时也与微软的必应和新兴搜索型 AI 聊天机器人服务 Perplexity 形成竞争。 OpenAI 表示,ChatGPT 搜索功能会根据用户的需求自动决定是否检索网络,能够快速提供最新信息,并附上相关的网页链接。 官方博客表示,ChatGPT 搜索功能利用第三方搜索供应商的技术,并整合合作伙伴直接提供的内容,来满足用户的信息需求。
11/1/2024 7:14:03 AM
清源
独家丨字节招兵买马,拟在欧洲设立AI研发中心
知情人士透露,字节跳动目前已经开始寻找欧洲的 LLM 和 AI 方面技术大牛,积极招揽人才。 而纵观欧洲各国的 AI 技术水平,瑞士、英国和法国相对靠前。 其中,瑞士和英国都有不少知名院校。
10/31/2024 2:57:00 PM
晓楠
谷歌:Gemini API 用量 6 个月飙升 14 倍,明年将升级 AI 助手
科技媒体 The Decoder 昨日(10 月 30 日)发布博文,报道称谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在最新季度财报电话会议上,宣布 Gemini API 用量在过去 6 个月内飙升了 14 倍。 皮查伊表示谷歌已经在 Google Maps、Google Search 等核心业务中整合 Gemini,目前已初步覆盖 20 亿用户,此外独立 Gemini 应用和嵌入的 Android Assistant 也见证了强劲的用户增长。 谷歌的云计算部门已经开始受益于人工智能的繁荣,收入增长了 35%,达到 114 亿美元,这包括人工智能和第三方服务,该部门的营业收入从去年的 2.7 亿美元增长到了 19.5 亿美元。
10/31/2024 2:49:52 PM
故渊
Python 成 GitHub 最受欢迎编程语言,AI 成主要推动力
GitHub 年度报告《Octoverse》显示,Python 首次超越 JavaScript 成为 GitHub 上最受欢迎的编程语言。 这主要是受到人工智能(AI)开发需求激增的推动,Python 还被广泛应用于数据科学和开源项目的开发。 报告指出,与生成式 AI 相关的项目贡献量在过去一年中增长了 59%,AI 相关的公共项目的贡献量几乎比 2023 年翻了一番,印度、德国、日本和新加坡是这些贡献的主要来源。
10/31/2024 2:00:24 PM
远洋
95 后创业者 VAST 宋亚宸:要做3D「抖音」内容平台
2022 年 9 月接近尾声的一天,Google 发布了文生 3D 技术DreamFusion,利用预训练的 2D 文本到图像扩散模型,提出SDS(score distillation scapling)方法,首次完成开放域文本到 3D的合成。 听到这个消息时,宋亚宸非常激动,他在商汤时就很关注 3D 生成技术。 DreamFusion的发布对于整个3D领域是一个大的转折点,意味着 3D内容制作的成本和门槛趋近于零,虽然生成的 3D模型效果很差,但已经是一个大的技术变革。
10/31/2024 11:26:00 AM
张进
实时音视频领域拓荒者的十年
2015 年,声网将WebRTC大会引入中国,筹办了第一届面向国内开发者、业务人员和用户的RTC(实时视音频)大会。 在大会开始的前夕,现任声网市场VP、RTC大会主策人彭小欢失眠了,她非常担心明天会不会有人来。 一晃十年过去了,当年的RTC大会早已升级为RTE(实时互联网)大会, 10 月 25 日RTE 2024也如期而至,但早已不用担心是否有人光顾,现场可谓是座无虚席。
10/31/2024 10:31:00 AM
张进
OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台,对话更自然
OpenAI 今日宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。 AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。 OpenAI 表示,AVM 提供了更自然、实时的对话体验,能够实时感知和回应用户的情绪。
10/31/2024 7:47:23 AM
远洋
OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”
当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。 当前的语言模型有时会产生错误输出或未经证实的答案,这一问题被称为“幻觉”。
10/31/2024 7:26:30 AM
清源
OpenAI 约 75% 收入来自消费者订阅,ChatGPT 周活跃用户数达 2.5 亿
感谢据彭博社报道,OpenAI 约 75% 的收入来自消费者订阅,这一数据由首席财务官 Sarah Friar 透露。 图源 PexelsOpenAI 的消费者战略以 ChatGPT 产品为核心,每月订阅费用为 20 美元(AI在线备注:当前约 143 元人民币)起。 报道称,OpenAI 成功将 5% 至 6% 的免费用户转化为了付费会员。
10/30/2024 9:11:57 AM
远洋
消息称 OpenAI 正与博通、台积电联手,共同打造自研芯片
感谢北京时间今天凌晨,据路透社援引知情人士消息称,OpenAI 正携手 Broadcom 和台积电开发首款自研 AI 芯片,并在英伟达芯片的基础上增添 AMD 芯片,以应对急剧扩张的基础设施需求。 成长势头正猛的 OpenAI 是 ChatGPT 背后的公司,其正在多方探索多样化芯片供应渠道,降低成本,曾考虑自行生产,并为一项建造“晶圆厂”网络的高昂计划筹资,全面掌控芯片制造。 不过,由于该计划耗资巨大且时间漫长,OpenAI 已暂时搁置建厂计划,转向内部设计芯片。
10/30/2024 7:34:34 AM
清源
谷歌 CEO 桑达尔・皮查伊:努力在明年推出具有可视化功能的 AI 助理
北京时间今天凌晨,谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。 他表示,谷歌正在构建能够识别和推理用户周围环境的 AI 体验,“‘Project Astra’代表了这种未来的初步探索。 我们正力争在 2025 年尽早推出类似体验。
10/30/2024 7:24:46 AM
清源
神秘模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了! ! 登顶文生图竞技场,直接将 Flux、Midjourney 等一众顶尖模型踩在脚下 ——其 ELO 得分比 Flux 1.1 Pro 高出 100 多,胜率高达 79%,每 7 秒就能生成一张图像。
10/29/2024 1:35:35 PM
汪淼
资讯热榜
OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星
OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源)
ChatGPT重磅更新:新增图像库功能,可查看自己用GPT生成的所有图片
基于 Spring AI + MCP + DeepSeek-R1-7B 构建企业级智能 Agent 工具调用系统
OpenAI发布34页智能体实践指南:从网络搜索到代码编写
别再只玩ChatGPT了!OpenAI悄悄发布《构建 Agent 实战指南》 手把手教你打造智能体
OpenAI发布GPT-4.1指令提示工程指南
Midjourney图像编辑器迎来重大更新:全新UI、图层功能与智能工具上线
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
DeepSeek
AI绘画
数据
机器人
谷歌
模型
大模型
Midjourney
智能
用户
学习
开源
GPT
微软
Meta
AI创作
图像
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
生成式
芯片
代码
英伟达
腾讯
神经网络
计算
研究
Sora
AI for Science
3D
Anthropic
AI设计
机器学习
GPU
开发者
场景
华为
预测
人形机器人
伟达
Transformer
百度
深度学习
AI视频
苹果
模态
xAI
字节跳动
驾驶
文本
搜索
大语言模型
具身智能
Claude
Copilot
神器推荐
LLaMA
算力
安全
应用
视频生成
视觉
科技
亚马逊
大型语言模型
干货合集
特斯拉
2024
AGI
训练