AIGC宇宙 AIGC宇宙

字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型

作者:远洋
2025-04-17 10:50
字节跳动发布豆包1.5深度思考模型,采用MoE架构,总参数200B,激活参数20B,推理成本低于业界50%。新模型在数学、编程、科学推理及创意写作等任务中表现突出,还能结合视觉理解技术提供更多功能。#AI大模型##字节跳动#

在今日火山引擎 AI 创新巡展杭州站现场,字节跳动旗下火山引擎总裁谭待发布了最新的豆包 1.5・深度思考模型。

字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型

据介绍,该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出。同时,模型采用 MoE 架构,总参数 200B,激活参数为 20B,低于业界同类模型参数规模的 50%,具备显著的推理成本优势。

谭待在会上详细介绍了豆包 1.5 深度思考模型的强大功能。该模型能够结合视觉理解技术提供更多功能,例如根据照片分析地貌,或在旅行时辅助点餐、完成企业项目管理流程图。

与此同时,火山引擎还对豆包文生图模型进行了 3.0 版本升级,带来包括更美观的文字排版,更精细的图片生成能力,以及 2k 图片直出能力。

值得关注的是,新模型的视频搜索能力也更强,模型能够根据用户搜索问题在视频中寻找相应答案。

同时AI在线注意到,谭待表示,豆包大模型使用量持续高速增长。截至 2025 年 3 月,豆包大模型日均 tokens 使用量超 12.7 万亿,较发布之初增长超 106 倍。

相关资讯

刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了

这几天的大模型圈子,特别热闹。 凌晨是 OpenAI 的 o3 和 o4-mini,一觉醒来,国内这边的豆包大模型又上新了一波。 巧合的是,都是能看懂图像、能调用工具的新一代推理模型。
4/17/2025 8:49:00 PM
机器之心

DeepSeek 反思潮:AGI 既被重新审视,又被持续低估

2 月很有意思。 一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。 很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级。
2/28/2025 11:45:00 PM
陈彩娴

字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%

字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。
3/10/2025 5:42:41 PM
远洋