Adobe 与 OpenAI 联手:让修图变得简单有趣
根据 TipRanks 的报道,Adobe 近期宣布与 OpenAI 建立新的合作关系,双方将深度整合各自的核心产品。 未来,用户可以通过 ChatGPT 平台,利用自然语言进行图片编辑。 这一合作不仅扩展了 AI 驱动的创意工具应用场景,也为用户带来了更为便捷的操作体验。
10/30/2025 4:56:17 PM
AI在线
OpenAI 再出开源力作 Safeguard 模型:可完整展示 AI“思维链”,强化内容分类能力
10 月 30 日消息,科技媒体 NeoWin 昨日(10 月 29 日)发布博文,报道称 OpenAI 公司推出 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款开源权重模型,专门用于根据用户提供的策略对内容进行推理、分类和标记。 这是继今年早些时候发布 gpt-oss 系列推理模型后,OpenAI 在开源领域的又一重要举措。 新模型是此前 gpt-oss 模型的微调版本,同样遵循宽松的 Apache 2.0 许可证,允许任何开发者免费使用、修改和商业部署。
10/30/2025 4:21:13 PM
故渊
大模型去全球接单平台赚外快,98%惨遭老板退货!ScaleAI宣布新智能体基准:AI绝对自动化几乎为0,大多知名基准过时、封闭
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)如果让大模型去外包平台去接单,它真的可以赚到钱吗? 现在终于有专业的评测机构站出来公布答案了。 不用硬夸AI,事实是让它接单,它会饿死。
10/30/2025 1:30:49 PM
云昭
OpenAI推出两款全新的开源安全推理模型
在人工智能浪潮迭起的今天,OpenAI 再次投下一颗重磅炸弹,正式向全球推出了两款全新的开源安全推理模型,它们的名字注定将刻印在 AI 安全的新篇章上:gpt-oss-safeguard-120b 与 gpt-oss-safeguard-20b。 此举如同一声号角,宣告 OpenAI 在捍卫人工智能安全与可靠性的征途上,迈出了至关重要的一大步。 随着 AI 技术渗透到各个角落,安全挑战的迷雾也日益浓厚。
10/30/2025 9:51:53 AM
AI在线
ElevenLabs CEO预言:AI语音模型将走向“商品化”,公司押注“模型+应用”双轮驱动
在TechCrunch Disrupt2025大会上,AI语音巨头ElevenLabs联合创始人兼CEO马蒂·斯塔尼斯泽夫斯基(Mati Staniszewski)做出一项惊人判断:AI语音模型将在未来两三年内走向“商品化”——尽管短期内仍是核心竞争力,但长期来看,模型之间的性能差异将逐渐缩小,尤其在主流语言和通用音色上。 图源备注:图片由AI生成,图片授权服务商Midjourney短期靠模型,长期靠产品面对“既然模型终将同质化,为何还要重投入研发”的质疑,Staniszewski坦言:“今天,模型仍是最大的技术壁垒。 如果AI语音听起来不自然、不流畅,用户体验就无从谈起。
10/30/2025 9:51:45 AM
AI在线
估值直指1万亿美元!OpenAI IPO进程加速,2027年或成AI史上最大IPO
在人工智能重塑全球经济的浪潮中,OpenAI正站在历史性资本里程碑的门槛上。 据路透社援引多位知情人士消息,这家全球最具影响力的AI公司正积极筹备首次公开募股(IPO),估值有望突破1万亿美元(约合7.1万亿元人民币),一旦成行,将成为科技史上规模最大的IPO之一,比肩甚至超越昔日的Facebook与阿里巴巴。 万亿估值背后:200亿美元年化收入与持续烧钱并存尽管OpenAI官方发言人谨慎表示“上市并非当前首要目标”,但其财务数据已显露商业化加速迹象:预计2025年底年化收入将达200亿美元,主要来自ChatGPT Enterprise、API调用、Sora应用商店及企业级Agent平台。
10/30/2025 9:51:20 AM
AI在线
如何理解:高效的异构算力调度是业界目前面临的一大难题?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建大模型应用架构设施底座:异构算力。 在后摩尔时代与AI爆发的双重驱动下,计算架构正经历一场从同构到异构的深刻变革。 以 GPU、NPU、FPGA、DPU .
10/30/2025 9:45:53 AM
Luga Lee
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
Cursor的首个编码模型,刚刚发布了! 最新进展,Cursor 2.0正式发布,并且首次搭载了「内部」大模型。 没错,不是GPT、不是Claude,如今模型栏多了个新名字——Composer。
10/30/2025 9:13:55 AM
Amazon重磅新作SimRAG:让大模型“自我进化”,轻松适配专业领域问答任务
在大模型技术飞速发展的今天,通用大模型在日常对话、内容创作等场景中已展现出卓越能力,但当面对医学、科学、计算机等专业领域时,却常常“力不从心”。 分布偏移导致模型认知与领域数据脱节,高质量领域数据稀缺推高训练成本,传统RAG技术又难以精准捕捉领域信息——这些痛点成为大模型落地专业场景的关键阻碍。 而Amazon在2025年NAACL会议上发表的SimRAG(Self-Improving Retrieval-Augmented Generation) 框架,为解决这些问题提供了全新思路。
10/30/2025 8:57:54 AM
Goldma
DeepSeek-OCR:用视觉模态给长文本“瘦身”,大模型处理效率再突破
在大语言模型(LLMs)不断拓展能力边界的今天,长文本处理始终是道绕不开的坎——文本序列每增加一倍,计算量就可能翻四倍,像处理一本几十万字的书籍、一份上千页的金融报告时,内存溢出、推理卡顿成了常态。 但DeepSeek团队最近开源的DeepSeek-OCR模型,给出了一个全新解法:把文本“画”成图像,用视觉Token实现高效压缩。 原本需要1000个文本Token存储的内容,现在100个视觉Token就能搞定,还能保持97%的OCR精度。
10/30/2025 7:00:00 AM
Goldma
一键生成品牌营销物料!谷歌发布重磅AI设计产品Pomelli
一、谷歌实验室新成员. 我们都知道谷歌如果想要尝试什么 AI 产品或者想法的话会先在它们的 Google Labs 里面发布,如果反响好的话就会独立运营,变成单独的产品。 比如我们之前耳熟能详的 ImageFX(用 Imagen 图像模型混合和生成图像)、Flow(使用 Veo 3 视频模型创作视频)、NotebookLM(帮你用各种模态解释文档和视频)等。
10/30/2025 6:50:03 AM
歸藏
从7天缩短到10分钟!腾讯全新的AI全流程3D建模神器太强了!
最近我试了不少AI生成3D模型的工具,比如Tripo AI,Meshy AI之类的,玩了一圈,发现目前最有机会用到项目里的是腾讯新出的AI工具,叫混元3D Studio。 它能做从建模开始,到拓扑低模,到拆UV,画材质,甚至连绑定和动作都能做了,最后还能导出各种常用模型格式fbx,gltf之类的,可以说是非常贴近项目所需了,不愧是做游戏的行家。 要知道,现在在游戏行业,在美术资产这块基本上是项目成本最大的部分,要是能降下来的话,价值非常高。
10/30/2025 1:30:26 AM
彩云Sky
从反馈中学习:强化学习如何提升百晓生问答精准度
第一部分:引言在人工智能技术飞速发展的今天,智能问答系统已成为连接信息与用户的重要桥梁,它们不仅重塑着人机交互方式,更在提升服务效率、优化知识获取路径等方面展现出巨大潜力。 在此背景下,"百晓生"作为一款基于RAG(检索增强生成)与外挂知识库的大型语言模型(LLM)驱动的问答产品,专注于为上门工程师提供精准的质检知识答疑服务。 经过一年的持续迭代与优化,该产品已从最初的10%小流量实验,逐步开放至全国范围,目前每日稳定为超过3000名工程师提供支持,连续多周问答准确率保持在90% 。
10/30/2025 1:22:00 AM
车天博、李俊波、李莹莹
AI友好型组件库才是未来?4个特点帮你快速了解!
随着 AI 大模型在 B 端设计领域的应用深入,引发出了一个新的概念:AI Friendly 组件库,也就是指专为适配、协同或 AI 功能而设计的 UI 组件集合,核心是让组件能与 AI 模型、算法或交互逻辑高效融合,而非仅服务于传统人工操作的界面呈现。 我所理解的 AI Friendly 组件库功能及特性有以下几个维度:组件库支持 AI 自动生成业务组件. 组件库能够调用 AI 能力完善功能.
10/30/2025 12:40:28 AM
Ant Design 元尧
DeepSeek-OCR:OCR 的新突破
DeepSeek 近日发布了DeepSeek-OCR。 这不仅仅是一个 OCR 模型,而是一个概念验证,它可能会从根本上改变我们在大型语言模型中对上下文的理解。 这个想法是这样的:如果不是向 LLM 输入数千个文本标记,而是将该文本压缩成图像,并用 100 个视觉标记来表示它,而不会损失准确性,那会怎样?
10/29/2025 4:42:06 PM
晓晓
Soul App开源播客语音合成模型,可流畅自然多轮语音对话,支持川粤豫等多方言与副语言风格
Soul App AI团队(Soul AI Lab)正式开源播客语音合成模型SoulX-Podcast。 该模型是一款专为多人、多轮对话场景打造的语音生成模型,支持中、英、川、粤等多语种/方言与副语言风格,能稳定输出超60分钟、自然流畅、角色切换准确、韵律起伏丰富的多轮语音对话。 除了播客场景以外,SoulX-Podcast在通用语音合成或克隆场景下也表现出色,带来更真实、更生动的语音体验。
10/29/2025 4:35:27 PM
量子位的朋友们
OpenAI终于快要上市了,也直面了这23个灵魂拷问
OpenAI昨天晚上9点,公布了一个消息。 这个事,影响还蛮大的,基本代表着,OpenAI在开始准备上市了。 图片然后,奥特曼也非常临时的宣布了重组的消息,以及,北京时间凌晨1点半,开始直播。
10/29/2025 4:29:27 PM
数字生命卡兹克
前字节剪映 AI 产品负责人廖谦创业,推出营销多模态 Agent
据智能涌现消息,前字节跳动剪映 AI 产品负责人廖谦宣布创立新公司 “极致上下文”,专注于打造一款营销多模态 Agent。 这一消息引发了业界的广泛关注,因为廖谦在 AIGC(人工智能生成内容)领域积累了丰富的经验,并且在短时间内成功完成数百万美元的首轮融资。 廖谦在其职业生涯中,曾在腾讯和字节跳动等知名企业担任要职。
10/29/2025 3:06:55 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
芯片
Agent
腾讯
Stable Diffusion
苹果
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
RAG
研究
AI视频
生成
大语言模型
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
架构
DeepMind
生成式AI
编程
视觉
预测
Transformer
AI模型
伟达
亚马逊
特斯拉
