随便哼两句就能变歌曲,还有国宝歌手帮你演绎,音乐的 Dall·E 2 时刻来了
机器之能报道
编辑:Sia
一个模型+两个功能=仅从文本提示就能生成引人入胜的音乐和歌声。
你是否有过这样的体验,脑海不时冒出各种旋律,却因对乐器一窍不通,无法将这些创意释放出来?
今天 ,YouTube 和 Google DeepMind 强强联合推出的新服务能让你的创意和音乐实现无缝转化。
在 Google DeepMind 提供的最复杂的 AI 音乐生成系统 Lyria 帮助下,YouTube 正在测试新的音乐生成功能:
仅用文本提示或者简单哼唱几句,AI 就能立刻生成一段引人入胜的音乐或歌曲。
最先推出的一个服务叫 Dream Track,可自动生成模仿某音乐人声音、风格的 30 秒音乐曲目,甚至包括歌词。
目前有 9 位流行音乐音乐人参与了这项合作,他们是 Alec Benjamin、Charlie Puth、Charli XCX、Demi Lovato、John Legend、Papoose、Sia、T-Pain 和Troye Sivan,以美国和澳洲歌手为主,饶舌说唱歌手相对多一点。
部分合作音乐人:Troye Sivan, Demi Lovato, John Legend (从左到右)
澳洲国宝级歌手 Sia 也在合作之列
Dream Track 用户只需输入提示,比如文字输入 「佛罗里达州一个阳光明媚的早晨,R&B」( R&B ,节奏布鲁斯,一种曲风),再选择美国饶舌歌手 T-Pain :
马上就能得到一段 30 秒的音乐,里面歌手的声音是 T-Pain ,连歌词都替你生成了(当然,你也可以自己写):
这是音乐人美国歌手 Charlie Puth 风格的作品:
YouTube Shorts 中试用 Dream Track
将一段哼唱转化为一段管弦乐:
将 MIDI 键盘和弦转换为真实的合唱团人声:
将类似口技的打击节奏变成一段鼓循环:
YouTube 音乐 AI 工具的用户界面
Lyria 擅长使用器乐和人声生成高质量的音乐,在转换和保持音乐延续性方面做的不错,能让用户更细致地控制输出的风格和效果。
谷歌 DeepMind CEO 哈萨比斯表示,音乐生成的技能也是一个很好的例子说明大模型越来越具有「多模态」功能。OpenAI 的 ChatGPT 的最新版本除了文本之外还可以处理音频和图像。谷歌 DeepMind 正在开发自己的强大人工智能模型,称为 Gemini,据传具有多模式功能。
SynthID 通过将音频转换为二维可视化图谱来添加数字水印
打了水印音频的波形动画
发布这些新工具的几天前,YouTube 宣布了针对人工智能生成的深度伪造的新内容指导方针,旨在保护人们,并最终保护该平台的音乐行业合作伙伴。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者