Redian新闻
>
音乐也逃不过AIGC:国风摇滚都来得(内藏ikun彩蛋)

音乐也逃不过AIGC:国风摇滚都来得(内藏ikun彩蛋)

公众号新闻
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

“再多看一眼就会爆炸,再靠近点就快被融化”到底是个什么感觉?

(这是一句《只因你太美》中的歌词)

下面的音乐或许能让你体会到这种“从来未有”的feel,坤坤听了都会直呼内行。

这段音乐来自Meta最新推出的文生音乐工具MusicGen。

只需要输入一段文字,点击生成按钮就能得到一段最长30秒的音乐,而且支持中文。

不懂乐理也没关系,MusicGen还可以上传已有的音乐作为参照。

比如上面这段音乐就是结合了原曲旋律重新生成的。

如果你实在不知道怎么prompt,也可以像这位网友一样问问ChatGPT:

无论是国风还是摇滚风都能轻松驾驭,甚至是两者结合。

哪怕国风伴奏也难不倒MusicGen。

测试结果显示,MusicGen的综合评分比谷歌的MusicLM高出了5.36%。

有网友给出了详细的测评体验:

这个模型似乎没有专门针对乐队名称进行训练,但用已有的风格生成音乐时表现非常好。
……
尽管(项目)网站中的示例是(开发者)挑选过的,但这并不能否定它可以生成好的作品。

如何实现

音乐的合成涉及多段旋律以及多种音色(乐器)之间的协调。

而不同于语音合成,人类对音乐之中的不和谐因素更为敏感。

那么MusicGen是如何完成这一复杂任务的呢?

我们先来看看它的训练数据。

Meta团队一共使用了两万小时的音乐。

这之中包括一万条内部搜集的高质量音轨以及ShutterStock和Pond5素材库中的数据。

来自后两者的数据量分别为2.5万和36.5万。

这些音乐数据在32kHz下被重新采样,都配有流派、BPM等基本信息和复杂一些的文字说明。

除了上述训练数据,Meta团队还准备了评价数据集MusicCaps。

MusicCaps由5500条专业作曲家谱写的10秒长的音乐构成,其中包括一千条平衡各个音乐流派的子集。

说完训练数据,我们来具体看看MusicGen的工作流程。

第一步是将声音信息转化为token。

这一步使用的是Meta去年研发的卷积网络编码器EnCodec。

至于编码方式,Meta团队通过实验对四种不同的方式进行了测试。

最终,团队选择了延时模式(下图右下)并进行了精准建模。

最核心的Transformer部分,团队训练了300M、1.5B、3.3B三个不同参数量的自回归式Transformer。

在混合精度下,训练上述三个参数量的Transformer分别使用了32、64和96块GPU。

对于文字处理,在评估了多个前人成果后Meta团队最终选用了Google团队2020年提出的T5模型。

对于音乐旋律的调整,团队选用了无监督的方式进行,规避了监督数据不佳导致的过拟合问题。

最终,Transformer输出的数据被转换为对数形式,然后根据编码本生成最终的成品。

体验方式

目前,想要体验MusicGen,一共有三种方式。

第一种方式是直接用官方在Hugging Face发布的DEMO

(传送门见文末)

这种方法操作最为简单,点进链接就能用。

缺点是得排队,有时候还会赶上服务器被挤爆、重新building等情况。

第二种是通过谷歌Colab搭建。

比第一种多了个一键部署的步骤,不过也比较简单,官方已经把部署要用的代码准备好了。

(传送门见文末)

进入之后,点击左上角的运行按钮即可完成一键部署,然后会得到一个专属链接,点进去就可以体验了。

不过这种操作方式需要谷歌账号才能用。

第三种方式则是自行部署

你需要有足够性能的GPU,且已经安装了PyTorch2.0或以上版本。

使用下面的命令即可完成安装:

# Best to make sure you have torch installed first, in particular before installing xformers.
# Don't run this if you already have PyTorch installed.
pip install 'torch>=2.0'
# Then proceed to one of the following
pip install -U audiocraft  # stable release
pip install -U git+https://[email protected]/facebookresearch/audiocraft#egg=audiocraft  # bleeding edge
pip install -e .  # or if you cloned the repo locally

安装好后,使用【python app.py】命令即可运行。

传送门
Hugging Face:
https://huggingface.co/spaces/facebook/MusicGen
谷歌Colab:
https://colab.research.google.com/drive/1-Xe9NCdIs2sCUbiSmwHXozK6AAhMm7_i?usp=sharing

论文地址:
https://arxiv.org/abs/2306.05284
GitHub页面:
https://github.com/facebookresearch/audiocraft
参考链接:
[1]https://twitter.com/dr_cintas/status/1667597176145313793
[2]https://twitter.com/nikhilaravi/status/1667692767534006273
[3]https://news.ycombinator.com/item?id=36271926

线下嗨聊 AIGC两整天,稀土开发者大会来袭!

超值199元门票限量抢购中,转发海报有机会赢免费参会!

北京大学王选计算机研究所教授CCF 自然语言处理专委会秘书长万小军确认出席主论坛,来自字节跳动、腾讯、虾皮、Intel、Google等公司的技术嘉宾,将带来一整天的「大模型与AIGC 」分论坛。

6月30日-7月1日,北京见!扫码报名还可参与抽奖,扫海报二维码或点击阅读原文即可报名:

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
痛心!澳洲正在消失的世界奇观不止一个,一定要赶紧来打卡!百年网红地标也逃不过了...中国古偶剧火到海外!外国人也逃不掉“真香定律”?[干货] 四个跟 egg(蛋)有关的英语短语,好实用!摇滚歌手也可以反摇滚|张楚对谈分享会【周末去哪玩】6/10-6/11 | 六月节、昆虫节、山巅爵士音乐节、儿童摇滚音乐节、夏季老爷车展、沙堡&沙雕大赛一波芭比粉风暴占领全世界!这波谁也逃不过啊!!认识10天就闪婚的真夫妻,被网友磕疯!但再幸福的家庭也逃不过这个问题金融女职场生存图鉴:降薪也逃不过996,学历能力拼不过资源?道人笔记(六十九)良贾深藏若虚,君子盛德若愚白天公司上班,晚上街头露宿!新州数千无家可归者有工作没房住,富人区也逃不过...“CAQ骗了所有人!” 魁省移民管制升级, 多类申请新增法语要求, 留学生也逃不了…《心中的那片竹海》&《和光同尘》戴森,女明星也逃不过的真香定律誓用摇滚打破平庸的石家庄,能容下摇滚的反叛精神吗?¥79/3件!2023流行这种“去泥地里打滚都不脏”的冰凉白T!WakuWaku 夏日祭阿尼亚:和风浴衣+丸子头的可爱小菇凉!《懂懂学定投》011五年心得(剧终)悲哀,她怎么也逃不过被骂擦边古琴+摇滚+民谣,纽约中美青年音乐节卡内基音乐厅登场𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶内衣裤,软弹有度,上身0束缚~2023回国 中国经济的现状令人堪忧。。。48岁的纯爱女王崔智友,也逃不过逐步蔡明化?信用差保费就高!司机纪录良好也逃不掉 每年多花近$500多核处理器先驱Kunle Olukotun获得ACM大奖200万美金鸡娃也逃不掉高中辍学,有钱的爹妈到底图啥?刘德华气到发昏?辅导女儿写作业发飙:火遍40年的天王,也逃不过这块“心病”……大陆旅游误入的"国宾馆"- 其他摇滚之城PK摇滚之乡?石家庄、新乡相继“出招”“Rock(石) Home(家) Town(庄)”要打造中国“摇滚之城”,安排摇滚乐手随机坐公交,实现摇滚元素遍布全城…15.8亿Mega Million彩票大奖开出,佛州一人独中!41岁郭晶晶给老公庆生,眼尖网友:当妈后,住豪宅也逃不过这件事联合国发出警告:“全球灾难已经开始!”,中国也逃不过!沉痛哀悼彭慧敏主任【𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶无痕内裤】49元三条!巨巨巨好穿 !!简直就是辣妹顶配,食品级冰箱收纳盒【一日团】再不想结婚,你也逃不掉姻缘
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。