文章列表

分类

标签

3分钟完成3天工作量！实测GPT-4o外挂级生图效果

一、技术革新：AI 绘图从专业工具到自然语言交互的范式跃迁. OpenAI 这次给 GPT-4o 的图像功能直接掀桌了！现在大家还在纠结"生成质量够不够高清""边缘有没有锯齿"，人家早就玩起了"意念绘图"——你根本不用懂什么ControlNet、LoRA，对着手机唠嗑就能把专业设计师在SD里折腾半天的活儿全包圆了！

4/2/2025 7:23:12 AM

五幺六

随着OpenAI每小时新增一百万用户，企业AI主导地位的竞争进入新阶段

这一里程碑式的投资凸显了AI日益上升的重要性，也标志着企业技术格局的转变。有了如此庞大的资金储备，OpenAI在与谷歌、AWS等巨头的较量中，将有更强的持久力，在与合作伙伴微软的敏感关系中也将拥有更大的筹码，更不用说还有资金与Anthropic和马斯克创办的新公司xAI等强劲对手抗衡。在这轮融资结束之前，OpenAI是否有资金继续在顶级行列中竞争，仍是个未知数。

4/2/2025 7:00:00 AM

Matt Marshall

别怕AI抢饭碗！设计师未来最值钱的技能根本不是画图

想象一下，你是一个忙得焦头烂额的设计师，手上有个项目 deadline 近在眼前。需求方要的是一套复杂的设计方案，你却还在为一张图的细节调整抓耳挠腮。就在你准备熬夜加班时，一个 AI 助手跳出来，轻声说：“别急，我来帮你。

4/2/2025 6:56:26 AM

张彭彭

「DeepSeek-V3 技术解析」：无辅助损失函数的负载均衡

在混合专家模型（MoE）的实践中，负载不均衡俨然已成为制约模型性能提升的关键瓶颈之一。传统的均衡策略往往需要引入复杂的辅助损失函数，不仅增加了训练的复杂度，还可能干扰模型的核心学习目标。工程师们在提升模型效率的道路上，一直苦苦追寻着一个优雅而高效的平衡解决方案。

4/2/2025 2:17:00 AM

追求卓越的

大模型应用的能力分级

对大模型应用的能力分级就像给学生打分一样，能让我们更清楚它的本事有多大。能力分级能帮我们设定目标，知道AI现在能干什么，未来还要学什么。有了统一的分级方式，大家就能公平比较不同AI的水平，推动技术进步。

4/2/2025 1:25:00 AM

曹洪伟

DeepSeek-R1之后推理模型发展如何？Raschka长文梳理后R1时代14篇重要论文

近日，Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。在过去的几周里，研究人员推出了许多改进推理的新策略，包括扩展简单测试 - 时间规模化（S1）、关联思维链（Chain of Associated thoughts）、Inner Transformer 等方法。不仅如此，还有来自腾讯实验室的研究人员探索了 Thoughts Are All Over the Place，通过衡量不正确答案中的 token 效率来鼓励模型对每条推理路径进行更深入的探索；来自美国马里兰大学和橡树岭国家实验室等机构联合提出了 Recurrent Block，通过重复调用同一个循环体的方式，在推理阶段可以迭代任意多次；以及来自美国 Zoom 视频通讯公司的研究团队提出了 Chain of Draft（CoD），基于更接近人类推理的提示策略提出了草稿图，这是一种优先考虑效率和推理的提示词策略。

4/1/2025 4:14:00 PM

机器之心

关于大模型智能体意图识别不准确问题：function call 的缺陷

最近在研究大模型智能体也就是Agent的过程中，遇到了一个很严重的问题，直接影响到Agent的质量和效果；那就是意图识别不准确，也可以说是Agent的幻觉问题。其产生的原因就在于大模型有时无法准确识别出用户意图，无法准确调用相应的函数。意图识别不准确现在大模型技术在应用方面，主要有两大方向；其一就是大模型的创作能力，简单来说就是内容生成方面，如生成图片，文字，视频，也包括RAG等。

4/1/2025 12:10:00 PM

DFires

GPT-2后首次！OpenAI将开源带推理能力的开源权重模型！网友：能比DeepSeek R1强吗？

出品 | 51CTO技术栈（微信号：blog51cto）奥特曼发布X文，宣布了一个重磅推理开源权重模型：长话短说：我们即将在未来几个月发布一个强大的开源语言模型，具备推理能力，并希望与开发者交流如何让它更有用：！我们计划发布自 GPT-2 以来的首个开源语言模型。我们已经考虑了很久，但之前有其他优先事项。

4/1/2025 10:35:37 AM

刚刚，奥特曼官宣开源：自GPT-2之后，我们要发首个带推理能力的开放权重模型

OpenAI 终于又要「Open」一回了！今天凌晨，奥特曼发推宣布，OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型。 OpenAI 希望与广大开发者、研究者和社区交流合作，探讨如何让这个模型发挥最大作用。

4/1/2025 10:19:00 AM

机器之心

AI算法 | 如何训练自己的大模型？

1、第一阶段：二次预训练模型选择与转换在开始训练之前，需要选择一个合适的基础模型。本文以LLaMA-7B为例，简单介绍下。为了方便后续的操作，将LLaMA-7B模型转换为Hugging Face格式。

4/1/2025 9:54:09 AM

Goldma

打工人自救指南：Manus+DeepSeek+Coze破局AI淘汰

前言2025年的中国AI竞技场中，三股技术浪潮正深度重构普通人的生存法则——DeepSeek让普通人年也能享受硅谷级智囊服务；Manus让小微企业人力成本直降70%（简历筛选、财务核算等）；Coze的智能体孵化出了新兴职业（智能体架构师、智能体调教师等）。当人们还在争论AI是否替代人类时，这三个现象级工具已悄然定义了智能技术的三种进化路径：认知突破、执行闭环与生态革命。这场技术革命的核心分野，在于三者对人类能力的增强坐标差异：• DeepSeek强化认知维度：用强化学习与模型蒸馏技术，将专业决策的颗粒度细化至人类难以企及的层级（如投资策略模拟准确率达97.3%）；• Manus重构执行范式：通过规划-执行-验证（PEV）架构，替代HR筛选、财务核算等流程性工作，实现企业人力成本大幅度降低；• Coze激活创新生态：其插件市场增长率达200%，催生“智能体调教师”“智能体架构师”等新职业，让技术民主化从口号变为现实。

4/1/2025 9:49:06 AM

后端小肥肠