AIGC宇宙 AIGC宇宙

文章列表

3分钟完成3天工作量!实测GPT-4o外挂级生图效果

一、技术革新:AI 绘图从专业工具到自然语言交互的范式跃迁. OpenAI 这次给 GPT-4o 的图像功能直接掀桌了! 现在大家还在纠结"生成质量够不够高清""边缘有没有锯齿",人家早就玩起了"意念绘图"——你根本不用懂什么ControlNet、LoRA,对着手机唠嗑就能把专业设计师在SD里折腾半天的活儿全包圆了!
4/2/2025 7:23:12 AM
五幺六

随着OpenAI每小时新增一百万用户,企业AI主导地位的竞争进入新阶段

这一里程碑式的投资凸显了AI日益上升的重要性,也标志着企业技术格局的转变。 有了如此庞大的资金储备,OpenAI在与谷歌、AWS等巨头的较量中,将有更强的持久力,在与合作伙伴微软的敏感关系中也将拥有更大的筹码,更不用说还有资金与Anthropic和马斯克创办的新公司xAI等强劲对手抗衡。 在这轮融资结束之前,OpenAI是否有资金继续在顶级行列中竞争,仍是个未知数。
4/2/2025 7:00:00 AM
Matt Marshall

别怕AI抢饭碗!设计师未来最值钱的技能根本不是画图

想象一下,你是一个忙得焦头烂额的设计师,手上有个项目 deadline 近在眼前。 需求方要的是一套复杂的设计方案,你却还在为一张图的细节调整抓耳挠腮。 就在你准备熬夜加班时,一个 AI 助手跳出来,轻声说:“别急,我来帮你。
4/2/2025 6:56:26 AM
张彭彭

「DeepSeek-V3 技术解析」:无辅助损失函数的负载均衡

在混合专家模型(MoE)的实践中,负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。 传统的均衡策略往往需要引入复杂的辅助损失函数,不仅增加了训练的复杂度,还可能干扰模型的核心学习目标。 工程师们在提升模型效率的道路上,一直苦苦追寻着一个优雅而高效的平衡解决方案。
4/2/2025 2:17:00 AM
追求卓越的

大模型应用的能力分级

对大模型应用的能力分级就像给学生打分一样,能让我们更清楚它的本事有多大。 能力分级能帮我们设定目标,知道AI现在能干什么,未来还要学什么。 有了统一的分级方式,大家就能公平比较不同AI的水平,推动技术进步。
4/2/2025 1:25:00 AM
曹洪伟

DeepSeek-R1之后推理模型发展如何?Raschka长文梳理后R1时代14篇重要论文

近日,Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。 在过去的几周里,研究人员推出了许多改进推理的新策略,包括扩展简单测试 - 时间规模化(S1)、关联思维链(Chain of Associated thoughts)、Inner Transformer 等方法。 不仅如此,还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place,通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索;来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block,通过重复调用同一个循环体的方式,在推理阶段可以迭代任意多次;以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft(CoD),基于更接近人类推理的提示策略提出了草稿图,这是一种优先考虑效率和推理的提示词策略。
4/1/2025 4:14:00 PM
机器之心

关于大模型智能体意图识别不准确问题:function call 的缺陷

最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准确识别出用户意图,无法准确调用相应的函数。 意图识别不准确现在大模型技术在应用方面,主要有两大方向;其一就是大模型的创作能力,简单来说就是内容生成方面,如生成图片,文字,视频,也包括RAG等。
4/1/2025 12:10:00 PM
DFires

GPT-2后首次!OpenAI将开源带推理能力的开源权重模型!网友:能比DeepSeek R1强吗?

出品 | 51CTO技术栈(微信号:blog51cto)奥特曼发布X文,宣布了一个重磅推理开源权重模型:长话短说:我们即将在未来几个月发布一个强大的开源语言模型,具备推理能力,并希望与开发者交流如何让它更有用:! 我们计划发布自 GPT-2 以来的首个开源语言模型。 我们已经考虑了很久,但之前有其他优先事项。
4/1/2025 10:35:37 AM

刚刚,奥特曼官宣开源:自GPT-2之后,我们要发首个带推理能力的开放权重模型

OpenAI 终于又要「Open」一回了! 今天凌晨,奥特曼发推宣布,OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型。 OpenAI 希望与广大开发者、研究者和社区交流合作,探讨如何让这个模型发挥最大作用。
4/1/2025 10:19:00 AM
机器之心

AI算法 | 如何训练自己的大模型?

1、第一阶段:二次预训练模型选择与转换在开始训练之前,需要选择一个合适的基础模型。 本文以LLaMA-7B为例,简单介绍下。 为了方便后续的操作,将LLaMA-7B模型转换为Hugging Face格式。
4/1/2025 9:54:09 AM
Goldma

打工人自救指南:Manus+DeepSeek+Coze破局AI淘汰

前言2025年的中国AI竞技场中,三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务;Manus让小微企业人力成本直降70%(简历筛选、财务核算等);Coze的智能体孵化出了新兴职业(智能体架构师、智能体调教师等)。 当人们还在争论AI是否替代人类时,这三个现象级工具已悄然定义了智能技术的三种进化路径:认知突破、执行闭环与生态革命。 这场技术革命的核心分野,在于三者对人类能力的增强坐标差异:• DeepSeek强化认知维度:用强化学习与模型蒸馏技术,将专业决策的颗粒度细化至人类难以企及的层级(如投资策略模拟准确率达97.3%);• Manus重构执行范式:通过规划-执行-验证(PEV)架构,替代HR筛选、财务核算等流程性工作,实现企业人力成本大幅度降低;• Coze激活创新生态:其插件市场增长率达200%,催生“智能体调教师”“智能体架构师”等新职业,让技术民主化从口号变为现实。
4/1/2025 9:49:06 AM
后端小肥肠

OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

OpenAI终于要Open AI了! 一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。 这是自GPT-2以来,OpenAI首个开源的模型。
4/1/2025 9:46:08 AM
新智元

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

虽然又被GPT-4o吉卜力生图的光芒掩盖了,但毫无疑问,上周的另一技术核弹Gemini 2.5 Pro,也是无可争议的强! 在试用过程中,网友们逐渐发现,这个模型真的强到发指。 在门萨Norway的IQ测试中,它已经突破了130。
4/1/2025 9:17:00 AM
新智元

OpenAI重新开源!第一弹就推理模型,还不限制商用,“冲着DeepSeek来的”

一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。 上一次这样开源还是6年前推出GPT-2。
4/1/2025 8:45:15 AM

因流量压力,OpenAI 暂时禁用 Sora 新用户的视频生成功能

OpenAI因高流量压力暂时禁用Sora新用户的视频生成功能,现有用户仍可使用图像生成功能。CEO萨姆・奥尔特曼表示团队正加班维持服务。#OpenAI##Sora#
4/1/2025 7:58:42 AM
远洋

ChatGPT 新图像生成器可轻松生成逼真的假收据,OpenAI 回应

ChatGPT 4o的图像生成器被用于生成假餐厅收据,甚至添加污渍以增强真实性。虽然OpenAI表示图像包含元数据标记,但技术仍可能被滥用。#AI安全# #ChatGPT#
4/1/2025 7:38:45 AM
远洋

OpenAI 宣布完成 400 亿美元超大规模融资,估值达 3000 亿美元

OpenAI宣布完成400亿美元私募融资,估值达3000亿美元,由软银集团领投。新资金将用于推动AI研究、扩展计算基础设施及提升ChatGPT工具。部分资金将用于“星门”AI数据中心网络项目。#OpenAI融资# #人工智能#
4/1/2025 7:21:42 AM
远洋

OpenAI 官宣将发布自 GPT-2 以来的首个开放权重语言模型,并具有推理功能

到目前为止,用户只能通过 OpenAI 的界面或将其 API 密钥集成到他们的应用中来使用其模型,这意味着模型本身保持秘密和专有。
4/1/2025 7:06:52 AM
汪淼