应用
95 后创业者 VAST 宋亚宸:要做3D「抖音」内容平台
2022 年 9 月接近尾声的一天,Google 发布了文生 3D 技术DreamFusion,利用预训练的 2D 文本到图像扩散模型,提出SDS(score distillation scapling)方法,首次完成开放域文本到 3D的合成。 听到这个消息时,宋亚宸非常激动,他在商汤时就很关注 3D 生成技术。 DreamFusion的发布对于整个3D领域是一个大的转折点,意味着 3D内容制作的成本和门槛趋近于零,虽然生成的 3D模型效果很差,但已经是一个大的技术变革。
实时音视频领域拓荒者的十年
2015 年,声网将WebRTC大会引入中国,筹办了第一届面向国内开发者、业务人员和用户的RTC(实时视音频)大会。 在大会开始的前夕,现任声网市场VP、RTC大会主策人彭小欢失眠了,她非常担心明天会不会有人来。 一晃十年过去了,当年的RTC大会早已升级为RTE(实时互联网)大会, 10 月 25 日RTE 2024也如期而至,但早已不用担心是否有人光顾,现场可谓是座无虚席。
OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台,对话更自然
OpenAI 今日宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。 AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。 OpenAI 表示,AVM 提供了更自然、实时的对话体验,能够实时感知和回应用户的情绪。
OpenAI 开源 SimpleQA 新基准,专治大模型“胡言乱语”
当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。 AI 领域中的一个开放性难题是如何训练模型生成事实正确的回答。 当前的语言模型有时会产生错误输出或未经证实的答案,这一问题被称为“幻觉”。
OpenAI 约 75% 收入来自消费者订阅,ChatGPT 周活跃用户数达 2.5 亿
感谢据彭博社报道,OpenAI 约 75% 的收入来自消费者订阅,这一数据由首席财务官 Sarah Friar 透露。 图源 PexelsOpenAI 的消费者战略以 ChatGPT 产品为核心,每月订阅费用为 20 美元(AI在线备注:当前约 143 元人民币)起。 报道称,OpenAI 成功将 5% 至 6% 的免费用户转化为了付费会员。
消息称 OpenAI 正与博通、台积电联手,共同打造自研芯片
感谢北京时间今天凌晨,据路透社援引知情人士消息称,OpenAI 正携手 Broadcom 和台积电开发首款自研 AI 芯片,并在英伟达芯片的基础上增添 AMD 芯片,以应对急剧扩张的基础设施需求。 成长势头正猛的 OpenAI 是 ChatGPT 背后的公司,其正在多方探索多样化芯片供应渠道,降低成本,曾考虑自行生产,并为一项建造“晶圆厂”网络的高昂计划筹资,全面掌控芯片制造。 不过,由于该计划耗资巨大且时间漫长,OpenAI 已暂时搁置建厂计划,转向内部设计芯片。
谷歌 CEO 桑达尔・皮查伊:努力在明年推出具有可视化功能的 AI 助理
北京时间今天凌晨,谷歌 CEO 桑达尔・皮查伊在公司第三季度财报电话会议上透露了“Project Astra”计划的最新进展。 他表示,谷歌正在构建能够识别和推理用户周围环境的 AI 体验,“‘Project Astra’代表了这种未来的初步探索。 我们正力争在 2025 年尽早推出类似体验。
神秘模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了! ! 登顶文生图竞技场,直接将 Flux、Midjourney 等一众顶尖模型踩在脚下 ——其 ELO 得分比 Flux 1.1 Pro 高出 100 多,胜率高达 79%,每 7 秒就能生成一张图像。
OpenAI 语音转写工具 Whisper 被曝存在重大缺陷:会凭空生成大段虚假内容
当地时间 27 日,据美联社报道,超过十位软件工程师、开发人员和学术研究人员称,OpenAI 的语音转写工具 Whisper 存在一个重大缺陷:有时会凭空生成大段甚至整句虚假内容。 这些专家指出,这些生成的文本(AI在线注:业内通常称为“AI 幻觉”)可能涉及种族言论、暴力措辞,甚至杜撰的医疗建议。 专家们认为,这一问题尤其令人担忧,因为 Whisper 已被广泛应用于全球多个行业,包括用于翻译和转录访谈内容、生成常见消费科技文本及制作视频字幕。
Meta 推出 Llama 3.2 1B / 3B 模型量化版:功耗更低、可适用更多轻量移动设备
继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后,Meta 于 10 月 24 日发布了这两个模型的量化版本,量化后的模型大小平均减少了 56%,RAM 使用量平均减少了 41%,模型速度提高了 2 至 4 倍,同时降低了功耗,使这些模型能够部署到更多移动设备上。 AI在线注:模型量化(Model Quantization)就是通过各种训练方式将浮点模型转为定点模型,可以压缩模型参数,降低模型的复杂性,以便于在更轻量的平台运行。 Meta 表示,他们采用了量化感知训练(Quantization-Aware Training,QAT)和后训练量化(SpinQuant)两种方法对模型进行量化,其中“量化感知训练”更重视模型的准确性,而“后训练量化”更强调模型的可移植性。
可令 AI 助理同时进行快 / 慢速思考,谷歌 DeepMind 公布具备两种思维模式的 Talker-Reasoner 框架
谷歌 DeepMind 上周公布了一个号称“具备两种思维模式”的 Talker-Reasoner 框架,旨在让 AI 助理能够同时进行快速和慢速思考,目前相关论文已发布于 ArXiv 上(点此访问)。 据介绍,这款框架采用“双系统”设计,能够在与用户进行对话的同时并行多步骤推理任务(一边快速回答用户问题,一边高速思考),其中系统 1 Talker LLM 主要负责快速、直觉和合成的语言回应,用于与用户交谈。 而系统 2 Reasoner LLM 则负责解决复杂问题,涉及从外界获取信息以增强知识,例如调用工具或从外部数据库检索信息,从而提升系统 1 回应内容的准确度及逻辑性。
Claude 接管人类电脑编程:程序员沸腾、OpenAI 反击,智能体大战一触即发
AI 接管人类电脑,未来已来! Claude 自主操控电脑,从编程到科研无所不能,代表着万能 API。 另一边,OpenAI 内部加急研发多智能体 AI,已经有了雏形。
阿尔特曼回应 OpenAI 计划推出下一代模型 Orion:假消息失控了
今天午间,OpenAI 首席执行官山姆・阿尔特曼在 X 平台回应了近期有关“下一代模型 Orion”的报道:fake news out of control(假消息失控了)。 AI在线附前情提要:今天早些时候有外媒报道称,OpenAI 计划今年 12 月推出代号为“Orion”的新款前沿模型。 “Orion”采用有别于 GPT-4o 和 o1 的发布模式,不会通过 ChatGPT 广泛发布,而是先授权与其密切合作的公司,帮其构建自己的产品和功能。
全球最强模型:OpenAI 被曝 12 月推出 Orion,AI 性能百倍级跃升
科技媒体 The Verge 今天(10 月 25 日)发布博文,报道称 OpenAI 计划今年 12 月推出代号为“Orion”的新款前沿模型。 AI在线援引该媒体报道,“Orion”采用有别于 GPT-4o 和 o1 的发布模式,不会通过 ChatGPT 广泛发布,而是先授权与其密切合作的公司,帮其构建自己的产品和功能。 此外消息源还表示微软内部工程师正在准备最早于 11 月在 Azure 上托管“Orion”。
论文发表难,OpenAI又有高管走了,还发了篇长文
OpenAI 的离职潮仍未止息。 这一次离开的是 Miles Brundage,他是 OpenAI 一位资深研究者和管理者,于 2018 年加入 OpenAI,离职前担任 AGI Readiness 团队的高级顾问,之前还曾领导过 Policy Research 团队。 更早之前,他曾在牛津大学人类未来研究所从事研究工作。
OpenAI 未来 AI 战略新变数,高级顾问 Miles Brundage 本周将离职
科技媒体 maginative 昨日(10 月 23 日)发布博文,报道称迈尔斯・布伦达奇(Miles Brundage)宣布将于本周从 OpenAI 公司离职,去追求独立的 AI 政策研究。 布伦达奇是 OpenAI 公司的 AGI Readiness 高级顾问,已在 OpenAI 公司工作 6 年时间,期间他塑造了许多 OpenAI 关键的部署和安全实践。 布伦达奇在声明中表示,他希望能跳出行业内,从行业外影响和推动人工智能的发展。
OpenAI 遭前研究员炮轰:违反版权法、ChatGPT 破坏互联网
北京时间 10 月 24 日,OpenAI 前研究员苏奇尔・巴拉吉 (Suchir Balaji) 在接受《纽约时报》采访时称,OpenAI 违法了版权法,该公司推出的 ChatGPT 正在破坏互联网。 巴拉吉认为 OpenAI 违反版权法巴拉吉在 OpenAI 担任了近四年的人工智能研究员,协助收集和整理公司用于开发聊天机器人 ChatGPT 的大量互联网数据。 当时,他并没有仔细考虑 OpenAI 是否有合法权利以这种方式开发产品,以为公司可以自由使用任何互联网数据,无论这些数据是否受版权保护。
科大讯飞星火 4.0 Turbo 大模型发布:七大能力全面超越 GPT-4 Turbo
在今日上午的 2024 科大讯飞全球 1024 开发者节上,科大讯飞正式发布“讯飞星火 4.0 Turbo”。 讯飞星火 4.0 Turbo 号称迎来全新升级,七大能力全面超越 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o。 在数学能力方面,讯飞星火 4.0 Turbo 已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类 o1 的高难度数学能力。