谷歌免费发布AI音乐合奏工具MRT2,Apple芯片用户可实时玩
电脑上实时运行。这让模型对输入变化的反应明显更快,更接近真实乐器的演奏体验。对于鼓组,系统也支持切换有鼓或无鼓输出,适合多轨编曲场景。免费应用,支持用户输入想要的音乐风格描述,随后模型开始生成音乐;用户还可通过下方键盘调整音高。键盘,这让实时控制更接近传统电子乐器和数字编曲工作流。
谷歌此次弄出了个规模颇大的行动。在6月4日, 其团队公布了MusicRL 2(MRT2)模型, 并且还免费发放出了Jam应用以及DAW插件。这一事物并非寻常的音乐生成器, 却是那种能够同你一道进行即兴演奏的AI伙伴, 其反应速度快到能使人感到吃惊。
MRT2有两个版本可选

谷歌针对苹果芯片优化后推出了两种规模的MRT2模型, 其中高质量版本有24亿参数, 其追求音质与表现力, 高速版仅有2.3亿参数, 主打低延迟以及流畅交互, 这两个版本在搭载M1及后续芯片的Mac电脑上可实时运行, 无需专门购置昂贵硬件。
延迟降到前代的十五分之一

MusicRL的上一代存在这样的情况 需要TPU或者高性能GPU 其控制延迟大概为3秒 并且还只能以2秒的音频块作为单位进行响应 MRT2则改成了逐帧生成 每帧所需时间仅为40毫秒 实际控制延迟大约只有200毫秒 这样的进步致使模型对于输入变化的反应加快了15倍 从而演奏起来更接近于真实乐器的手感。
控制方式比前代更完整
MRT2对文本以及音频风格提示予以支持, 对于MIDI音符和鼓开关控制同样予以支持, 模型能够持续依照音符输入的改变而跟随, 于Auto – Strum模式当中, 它能够自动对拨弦或者起音的时机作出决定, 要是你期望拥有更为精细的控制, 将这个模式关闭, 便能够精确地对每个音符的起始时刻予以指定, 鼓组部分还能够对有鼓或者无鼓输出进行切换, 适宜多轨编曲。
技术底层依然是编解码器语言模型
编解码器语言模型的架构依旧是MRT2, 它依据谷歌的音频编解码器来处理48kHz的立体声音频进而以25Hz帧率能够生成音频标记, 如此技术路线保障了音质与实时响应能力的平衡, 使得AI可以流畅领会你的演奏意图, 并且能够迅速做出反应。
Jam应用让普通人也能玩音乐

谷歌同步推出了一款名为Jam的免费应用, 你只要输入想要的音乐风格描述, 模型便会开始生产音乐, 你还能够通过下方键盘去调整音高, 输入设备不但支持鼠标点击, 而且支持电脑键盘以及MIDI键盘, 这样的设计叫实时控制更贴近传统电子乐器与数字编曲工作流, 普通用户也能够轻松上手。
MRT2插件接入专业编曲环境
倘若你已然惯于在成熟编曲环境当中开展工作, MRT2插件给出了便捷的接入途径。凭借这个插件, 创作者能够在自身常用的DAW里直接调用MRT2。这表明专业音乐人无需改变工作习惯, 便能够将AI合奏能力融入到自身的创作流程之中, 进而提升效率以及创意空间。

你是否认为, 那种具备低延迟特性的MRT2这一AI音乐模型, 会于未来对音乐创作的方式产生改变呢, 欢迎在评论区去分享你所拥有的看法, 点赞以及转发从而让更多的人能够见到这个饶有趣味的技术突破。