OmniTools 6月5日消息,谷歌 Magenta 团队近日发布 Magenta RealTime 2(MRT2)本地实时音乐生成模型,并同步开源配套乐器应用 Jam 及 DAW 插件。
MRT2 提供两个版本:高质量版 mrt2_base(24 亿参数)与高速版 mrt2_small(2.3 亿参数),均针对苹果 Apple Silicon 芯片优化,其中 mrt2_small 可在 M1 及以上 Mac 设备上实时运行。
相比前代约 3 秒的延迟,MRT2 采用逐帧生成机制(每帧 40 毫秒),将端到端控制延迟降至约 200 毫秒,降幅达 15 倍。模型支持文本与音频风格提示、MIDI 音符输入、鼓开关控制及 Auto-Strum 模式,底层基于 Codec Language Model,使用 SpectroStream 编解码器处理 48kHz 立体声音频。