Stability AI 发布 Stable Audio 3.0 系列音频模型，最长可生成6分20秒音乐

2026/05/20 15:02

OmniTools 5月20日消息，Stability AI 正式发布 Stable Audio 3.0 系列音频生成模型，包含 small SFX（459M 参数）、small（459M 参数）、medium（1.4B 参数）和 large（2.7B 参数）四款模型。

其中，small 和 small SFX 模型支持端侧运行，可生成最长两分钟的音效与音乐；medium 与 large 模型则可生成长达6分20秒、结构完整且旋律连贯的专业级音乐，生成时长较2024年发布的 Stable Audio 2.0 提升超一倍。

small SFX、small 和 medium 模型以开源权重形式开放；large 模型仅通过 API 及付费自托管服务提供，年营收超100万美元的企业需获取企业授权。Stability AI 表示，该系列模型训练数据均获完全授权，并已与华纳音乐集团及环球音乐集团达成合作。

想继续了解，可以看这些

从这条动态出发，继续查看相关分析、产品详情和同主题更新。

从快讯延伸到产品观察、工具对比和行业分析。

按能力、行业和使用场景继续筛选可用工具。

通过自然语言描述快速构建应用与网站，并配套虚拟办公套件，实现从创意到上线的一体化工作流。

面向咖啡馆、健身房、餐厅等线下场所的 AI 智能 DJ 与正版背景音乐服务

AI 智能体远程审批控制面板：通过手机推送实现一键确认与多端协同

AI 驱动的自动化 QA 工具，通过 URL 或 GitHub 仓库自动探索应用、录制会话、发现真实 Bug 并提供根因与修复建议。