OmniTools 5月20日消息,Stability AI 正式发布 Stable Audio 3.0 系列音频生成模型,包含 small SFX(459M 参数)、small(459M 参数)、medium(1.4B 参数)和 large(2.7B 参数)四款模型。
其中,small 和 small SFX 模型支持端侧运行,可生成最长两分钟的音效与音乐;medium 与 large 模型则可生成长达6分20秒、结构完整且旋律连贯的专业级音乐,生成时长较2024年发布的 Stable Audio 2.0 提升超一倍。
small SFX、small 和 medium 模型以开源权重形式开放;large 模型仅通过 API 及付费自托管服务提供,年营收超100万美元的企业需获取企业授权。Stability AI 表示,该系列模型训练数据均获完全授权,并已与华纳音乐集团及环球音乐集团达成合作。