AIGC宇宙 AIGC宇宙

​Adobe 与 OpenAI 联手:让修图变得简单有趣

根据 TipRanks 的报道,Adobe 近期宣布与 OpenAI 建立新的合作关系,双方将深度整合各自的核心产品。 未来,用户可以通过 ChatGPT 平台,利用自然语言进行图片编辑。 这一合作不仅扩展了 AI 驱动的创意工具应用场景,也为用户带来了更为便捷的操作体验。
10/30/2025 4:56:17 PM
AI在线

OpenAI 再出开源力作 Safeguard 模型:可完整展示 AI“思维链”,强化内容分类能力

10 月 30 日消息,科技媒体 NeoWin 昨日(10 月 29 日)发布博文,报道称 OpenAI 公司推出 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款开源权重模型,专门用于根据用户提供的策略对内容进行推理、分类和标记。 这是继今年早些时候发布 gpt-oss 系列推理模型后,OpenAI 在开源领域的又一重要举措。 新模型是此前 gpt-oss 模型的微调版本,同样遵循宽松的 Apache 2.0 许可证,允许任何开发者免费使用、修改和商业部署。
10/30/2025 4:21:13 PM
故渊

大模型去全球接单平台赚外快,98%惨遭老板退货!ScaleAI宣布新智能体基准:AI绝对自动化几乎为0,大多知名基准过时、封闭

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)如果让大模型去外包平台去接单,它真的可以赚到钱吗? 现在终于有专业的评测机构站出来公布答案了。 不用硬夸AI,事实是让它接单,它会饿死。
10/30/2025 1:30:49 PM
云昭

OpenAI推出两款全新的开源安全推理模型

在人工智能浪潮迭起的今天,OpenAI 再次投下一颗重磅炸弹,正式向全球推出了两款全新的开源安全推理模型,它们的名字注定将刻印在 AI 安全的新篇章上:gpt-oss-safeguard-120b 与 gpt-oss-safeguard-20b。 此举如同一声号角,宣告 OpenAI 在捍卫人工智能安全与可靠性的征途上,迈出了至关重要的一大步。 随着 AI 技术渗透到各个角落,安全挑战的迷雾也日益浓厚。
10/30/2025 9:51:53 AM
AI在线

ElevenLabs CEO预言:AI语音模型将走向“商品化”,公司押注“模型+应用”双轮驱动

在TechCrunch Disrupt2025大会上,AI语音巨头ElevenLabs联合创始人兼CEO马蒂·斯塔尼斯泽夫斯基(Mati Staniszewski)做出一项惊人判断:AI语音模型将在未来两三年内走向“商品化”——尽管短期内仍是核心竞争力,但长期来看,模型之间的性能差异将逐渐缩小,尤其在主流语言和通用音色上。 图源备注:图片由AI生成,图片授权服务商Midjourney短期靠模型,长期靠产品面对“既然模型终将同质化,为何还要重投入研发”的质疑,Staniszewski坦言:“今天,模型仍是最大的技术壁垒。 如果AI语音听起来不自然、不流畅,用户体验就无从谈起。
10/30/2025 9:51:45 AM
AI在线

估值直指1万亿美元!OpenAI IPO进程加速,2027年或成AI史上最大IPO

在人工智能重塑全球经济的浪潮中,OpenAI正站在历史性资本里程碑的门槛上。 据路透社援引多位知情人士消息,这家全球最具影响力的AI公司正积极筹备首次公开募股(IPO),估值有望突破1万亿美元(约合7.1万亿元人民币),一旦成行,将成为科技史上规模最大的IPO之一,比肩甚至超越昔日的Facebook与阿里巴巴。 万亿估值背后:200亿美元年化收入与持续烧钱并存尽管OpenAI官方发言人谨慎表示“上市并非当前首要目标”,但其财务数据已显露商业化加速迹象:预计2025年底年化收入将达200亿美元,主要来自ChatGPT Enterprise、API调用、Sora应用商店及企业级Agent平台。
10/30/2025 9:51:20 AM
AI在线

如何理解:高效的异构算力调度是业界目前面临的一大难题?

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建大模型应用架构设施底座:异构算力。 在后摩尔时代与AI爆发的双重驱动下,计算架构正经历一场从同构到异构的深刻变革。 以 GPU、NPU、FPGA、DPU .
10/30/2025 9:45:53 AM
Luga Lee

Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构

Cursor的首个编码模型,刚刚发布了! 最新进展,Cursor 2.0正式发布,并且首次搭载了「内部」大模型。 没错,不是GPT、不是Claude,如今模型栏多了个新名字——Composer。
10/30/2025 9:13:55 AM

Amazon重磅新作SimRAG:让大模型“自我进化”,轻松适配专业领域问答任务

在大模型技术飞速发展的今天,通用大模型在日常对话、内容创作等场景中已展现出卓越能力,但当面对医学、科学、计算机等专业领域时,却常常“力不从心”。 分布偏移导致模型认知与领域数据脱节,高质量领域数据稀缺推高训练成本,传统RAG技术又难以精准捕捉领域信息——这些痛点成为大模型落地专业场景的关键阻碍。 而Amazon在2025年NAACL会议上发表的SimRAG(Self-Improving Retrieval-Augmented Generation) 框架,为解决这些问题提供了全新思路。
10/30/2025 8:57:54 AM
Goldma

DeepSeek-OCR:用视觉模态给长文本“瘦身”,大模型处理效率再突破

在大语言模型(LLMs)不断拓展能力边界的今天,长文本处理始终是道绕不开的坎——文本序列每增加一倍,计算量就可能翻四倍,像处理一本几十万字的书籍、一份上千页的金融报告时,内存溢出、推理卡顿成了常态。 但DeepSeek团队最近开源的DeepSeek-OCR模型,给出了一个全新解法:把文本“画”成图像,用视觉Token实现高效压缩。 原本需要1000个文本Token存储的内容,现在100个视觉Token就能搞定,还能保持97%的OCR精度。
10/30/2025 7:00:00 AM
Goldma

一键生成品牌营销物料!谷歌发布重磅AI设计产品Pomelli

一、谷歌实验室新成员. 我们都知道谷歌如果想要尝试什么 AI 产品或者想法的话会先在它们的 Google Labs 里面发布,如果反响好的话就会独立运营,变成单独的产品。 比如我们之前耳熟能详的 ImageFX(用 Imagen 图像模型混合和生成图像)、Flow(使用 Veo 3 视频模型创作视频)、NotebookLM(帮你用各种模态解释文档和视频)等。
10/30/2025 6:50:03 AM
歸藏

从7天缩短到10分钟!腾讯全新的AI全流程3D建模神器太强了!

最近我试了不少AI生成3D模型的工具,比如Tripo AI,Meshy AI之类的,玩了一圈,发现目前最有机会用到项目里的是腾讯新出的AI工具,叫混元3D Studio。 它能做从建模开始,到拓扑低模,到拆UV,画材质,甚至连绑定和动作都能做了,最后还能导出各种常用模型格式fbx,gltf之类的,可以说是非常贴近项目所需了,不愧是做游戏的行家。 要知道,现在在游戏行业,在美术资产这块基本上是项目成本最大的部分,要是能降下来的话,价值非常高。
10/30/2025 1:30:26 AM
彩云Sky

从反馈中学习:强化学习如何提升百晓生问答精准度

第一部分:引言在人工智能技术飞速发展的今天,智能问答系统已成为连接信息与用户的重要桥梁,它们不仅重塑着人机交互方式,更在提升服务效率、优化知识获取路径等方面展现出巨大潜力。 在此背景下,"百晓生"作为一款基于RAG(检索增强生成)与外挂知识库的大型语言模型(LLM)驱动的问答产品,专注于为上门工程师提供精准的质检知识答疑服务。 经过一年的持续迭代与优化,该产品已从最初的10%小流量实验,逐步开放至全国范围,目前每日稳定为超过3000名工程师提供支持,连续多周问答准确率保持在90% 。
10/30/2025 1:22:00 AM
车天博、李俊波、李莹莹

AI友好型组件库才是未来?4个特点帮你快速了解!

随着 AI 大模型在 B 端设计领域的应用深入,引发出了一个新的概念:AI Friendly 组件库,也就是指专为适配、协同或 AI 功能而设计的 UI 组件集合,核心是让组件能与 AI 模型、算法或交互逻辑高效融合,而非仅服务于传统人工操作的界面呈现。 我所理解的 AI Friendly 组件库功能及特性有以下几个维度:组件库支持 AI 自动生成业务组件. 组件库能够调用 AI 能力完善功能.
10/30/2025 12:40:28 AM
Ant Design 元尧

DeepSeek-OCR:OCR 的新突破

DeepSeek 近日发布了DeepSeek-OCR。 这不仅仅是一个 OCR 模型,而是一个概念验证,它可能会从根本上改变我们在大型语言模型中对上下文的理解。 这个想法是这样的:如果不是向 LLM 输入数千个文本标记,而是将该文本压缩成图像,并用 100 个视觉标记来表示它,而不会损失准确性,那会怎样?
10/29/2025 4:42:06 PM
晓晓

Soul App开源播客语音合成模型,可流畅自然多轮语音对话,支持川粤豫等多方言与副语言风格

Soul App AI团队(Soul AI Lab)正式开源播客语音合成模型SoulX-Podcast。 该模型是一款专为多人、多轮对话场景打造的语音生成模型,支持中、英、川、粤等多语种/方言与副语言风格,能稳定输出超60分钟、自然流畅、角色切换准确、韵律起伏丰富的多轮语音对话。 除了播客场景以外,SoulX-Podcast在通用语音合成或克隆场景下也表现出色,带来更真实、更生动的语音体验。
10/29/2025 4:35:27 PM
量子位的朋友们

OpenAI终于快要上市了,也直面了这23个灵魂拷问

OpenAI昨天晚上9点,公布了一个消息。 这个事,影响还蛮大的,基本代表着,OpenAI在开始准备上市了。 图片然后,奥特曼也非常临时的宣布了重组的消息,以及,北京时间凌晨1点半,开始直播。
10/29/2025 4:29:27 PM
数字生命卡兹克

前字节剪映 AI 产品负责人廖谦创业,推出营销多模态 Agent

据智能涌现消息,前字节跳动剪映 AI 产品负责人廖谦宣布创立新公司 “极致上下文”,专注于打造一款营销多模态 Agent。 这一消息引发了业界的广泛关注,因为廖谦在 AIGC(人工智能生成内容)领域积累了丰富的经验,并且在短时间内成功完成数百万美元的首轮融资。 廖谦在其职业生涯中,曾在腾讯和字节跳动等知名企业担任要职。
10/29/2025 3:06:55 PM
AI在线