Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品

Stability AI 近日发布新闻稿,宣布推出 Stable Audio2.0,可以基于用户输入的提示词,生成最长 3 分钟的完整音轨。Stable Audio 2.0 在此前 1.0 版本基础上,进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容,最长可以生成 3 分钟的音频内容。Stable Audio 2.0 扩充了生成功能之外,还提供了音频生成音频功能,基于用户上传的一小段音频内容,扩展生成、补充相关的音频内容。IT之家附上演示视频如下: 例如音乐家如果在创作某段音乐的时候“卡壳”了,可以上传某段

Stability AI 近日发布新闻稿,宣布推出 Stable Audio2.0,可以基于用户输入的提示词,生成最长 3 分钟的完整音轨。

Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品

Stable Audio 2.0 在此前 1.0 版本基础上,进一步为音频生成扩展了前奏、副歌、收尾和立体声效果等内容,最长可以生成 3 分钟的音频内容。

Stable Audio 2.0 发布:生成最长 3 分钟音频,能帮音乐家补全创意作品

Stable Audio 2.0 扩充了生成功能之外,还提供了音频生成音频功能,基于用户上传的一小段音频内容,扩展生成、补充相关的音频内容。IT之家附上演示视频如下:

例如音乐家如果在创作某段音乐的时候“卡壳”了,可以上传某段 DEMO,要求 Stable Audio 2.0 补充完整歌曲,让你的各种小创意都能转换为完整的音频内容。

Stable Audio 2.0 还支持定制、微调生成后的音频内容,换句话说,如果你不喜欢音频中的某些内容,你可以根据自己的具体需求改变风格。

Stability Audio 2.0 不仅能生成完整的音轨,还能帮助您制作各种声音和音频效果,从打字时发出的声音到人群背景声等等。

相关阅读:

《Stability AI 推出 Stable Audio,基于文本生成最长 90 秒音频》

相关资讯

Stable Audio Open 开源 AI 模型发布:48.6 万个样本训练,可创建 47 秒短音频 / 音效等

Stability AI 立足 Stable Diffusion 文生图模型,进一步向音频领域拓展,推出了 Stable Audio Open,可以基于用户输入的提示词,生成高质量音频样本。Stable Audio Open 最长可以创建 47 秒的音乐,非常适合鼓点、乐器旋律、环境音和拟声音效,该开源模型基于 transforms 扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。Stable Audio Open 目前已经开源,IT之家附上相关链接,感兴趣的用户可以在 Hugging

阿里通义千问开源 Qwen2-Audio 7B 语音交互大模型:自由互动,无需输入文本

感谢阿里通义千问开源 Qwen2-Audio 系列的两个模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。作为一个大规模音频语言模型,Qwen2-Audio 能够接受各种音频信号输入,并根据语音指令执行音频分析或直接响应文本,有两种不同的音频交互模式:语音聊天:用户可以自由地与 Qwen2-Audio 进行语音互动,而无需文本输入音频分析:用户可以在互动过程中提供音频和文本指令对音频进行分析官方在一系列基准数据集上进行了测试,Qwen2-Audio 超越了先前的最佳模型。▲ Q

短视频制作必看!6款AI神器帮你轻松定制高质量音乐素材

大家好,这里是和你们一起探索 AI 的花生~ 随着自媒体和短视频的发展,相应的对背景音乐的需求也越来越大。大家在找音乐素材的时候肯定遇到过很多问题,比如要花很长时间才能找到符合视频氛围的配乐,或者是担心版权问题,怕一个不注意就侵权了。而随着生成式 AI 技术的出现,这些问题都变得很好解决,因为我们可以直接用文字定制自己想要的音乐素材,还无需担心会有各种弯弯绕绕的版权规定,轻松搞定视频配乐。 相关推荐:之前给大家介绍过很多文生图、文生成视频的神器,那么通过文本生成的音乐质量又如何呢?我们可以先感受一下。视频中左侧是人