AIGC宇宙 AIGC宇宙

豆包深度思考和文生图3.0模型正式开放API 对企业客户开放

作者:AI在线
2025-04-17 02:01
豆包大模型近日发布了系列更新,其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API,供开发者和企业客户使用。 这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平,并在视觉推理和图像生成方面取得了显著进展。 豆包1.5·深度思考模型在专业领域推理任务中表现出色,数学推理 AIME2024测试得分追平 OpenAI o3-mini-high,编程竞赛 Codeforces pass@8得分接近 OpenAI o1,科学推理 GPQA 得分接近 o3-mini-high,均达到或接近全球第一梯队。

豆包大模型近日发布了系列更新,其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API,供开发者和企业客户使用。这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平,并在视觉推理和图像生成方面取得了显著进展。

豆包1.5·深度思考模型在专业领域推理任务中表现出色,数学推理 AIME2024测试得分追平 OpenAI o3-mini-high,编程竞赛 Codeforces pass@8得分接近 OpenAI o1,科学推理 GPQA 得分接近 o3-mini-high,均达到或接近全球第一梯队。在创意写作等非推理任务中,该模型也展示了优秀的泛化能力,能够胜任更广泛和复杂的使用场景。

为提升模型的通用能力,豆包团队优化了数据处理策略,融合了可验证与创意性数据,以满足各类任务需求。大规模强化学习是训练推理模型的关键技术,团队创新性地提出了双轨奖励机制,兼顾“对错分明”和“见仁见智”任务,并有效实现了算法的可靠优化。此外,团队还优化了底层架构,保障了训练的稳定性、可扩展性、可重复性和计算效率。

微信截图_20250417133712.png

豆包深度思考模型采用 MoE 架构,总参数为200B,激活参数仅20B,具备显著的训练和推理成本优势。基于高效算法和高性能推理系统,模型在提供极高并发承载能力的同时,实现了20毫秒的极低延迟。此外,该模型还具备视觉推理能力,能够像人类一样对看到的事物进行联想和思考,极大地拓展了智能推理的应用边界。

豆包文生图模型3.0是一个原生高分辨率、支持中英双语的图像生成基础模型,整体性能相比上一代有较大提升。该模型在分辨率、生图结构准确性、数量准确性、多物体属性关系、小字生成与排版、美感效果、真实度等方面取得了显著突破。Seedream3.0采取多项策略实现高效推理,1K 分辨率出图端到端仅需3秒,能够快速生成高品质图像,大幅提升创作效率。此外,该模型还优化了小字体高保真生成、多行文本语义排版等业界难题,让 AI 具备商业级图文设计能力。

在文生图权威竞技场 Artificial Analysis 上,豆包文生图模型 Seedream3.0与 GPT-4o、Imagen3、Midjourney v6.1、FLUX1.1Pro 等模型同台竞技,排名位居第一梯队。Seedream3.0已在字节跳动旗下豆包、即梦等平台全量开放,为企业客户提供了强大的图像生成能力。

豆包深度思考模型和文生图模型3.0的开放,为企业客户提供了更高效、更通用的推理能力和更强大的图像生成能力,进一步推动了 AI 技术在各行业的应用和发展。

豆包深度思考模型技术报告详见:https://github.com/ByteDance-Seed/Seed-Thinking-v1.5

Seedream3.0技术报告详见:https://team.doubao.com/tech/seedream3_0

相关资讯

推理能力飞跃?豆包1.5深度思考模型即将正式服务企业

火山引擎今日发布活动预热,正式宣布其新款豆包大模型将于明日(4月17日)在FORCE LINK AI创新巡展杭州站上隆重发布。 官方信息显示,此次发布会将带来豆包大模型家族的全新升级,并特别推出备受瞩目的豆包1.5深度思考模型。 此前已有消息透露,豆包APP和桌面端已针对“深度思考模式”进行了多轮实验性测试。
4/16/2025 6:01:15 PM
AI在线

刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了

这几天的大模型圈子,特别热闹。 凌晨是 OpenAI 的 o3 和 o4-mini,一觉醒来,国内这边的豆包大模型又上新了一波。 巧合的是,都是能看懂图像、能调用工具的新一代推理模型。
4/17/2025 8:49:00 PM
机器之心

日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?

2024 年的 AI 图像生成技术,又提升到了一个新高度。技术的飞速迭代,让这一领域的商业化落地进入加速阶段。前有 Midjourney v6 史诗级更新,后有开源巨头 Stable Diffusion 3 独领风骚,而 DALL・E 3 背靠 ChatGPT 这棵「大树」,也收获了众多用户的关注。当然了,在这条赛道上,来自国内的选手毫不逊色。近日,国产大模型「顶流」—— 字节跳动豆包大模型,迎来一场集中放送:在 2024 火山引擎 AI 创新巡展成都站活动上,豆包大模型团队公布了豆包大模型的最新进展,以及文生图模
7/29/2024 1:22:00 PM
机器之心