小米大模型 - AIGC宇宙

小米大模型团队在音频推理领域取得重大突破，登顶国际评测榜

近日，小米大模型团队在音频推理领域的研究中取得了突破性进展，成功应用强化学习算法于多模态音频理解任务，准确率达到了64.5%，这一成就使其在国际权威的 MMAU 音频理解评测中夺得了第一名。这一成果的背后，离不开团队对 DeepSeek-R1的启发。 MMAU（Massive Multi-Task Audio Understanding and Reasoning）评测集是衡量音频推理能力的重要标准，通过对包含语音、环境声和音乐的多种音频样本进行分析，测试模型在复杂推理任务中的表现。

小米大模型团队登顶音频推理 MMAU 榜，受到DeepSeek-R1启发

小米技术官方微博宣布，小米大模型团队在音频推理领域取得了显著进展。他们在受到 DeepSeek-R1的启发后，率先将强化学习算法应用于多模态音频理解任务。团队在短短一周内便以64.5% 的 SOTA（State Of The Art）准确率，登顶国际权威的 MMAU 音频理解评测榜，并同步将相关技术开源。