Redian新闻
>
AIGC基于文本生成音乐,现在压力来到配乐行业这边|Github

AIGC基于文本生成音乐,现在压力来到配乐行业这边|Github

公众号新闻
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

宇航员骑马奔驰,配什么BGM比较飒?这活交给AI试试!

输入文本“宇航员骑大马”,秒速生成一段1分钟的音频:

emmm……听起来好动感!

是的没错,AI可以基于文字提示生成音乐

上面这段演示视频,基于Deforum Stable Diffusion的Colab页面代码修改而来。

这只新项目的名字叫Mubert API,已在Github开源,获得1000多的标星。

推特上也有不少人已经用Mubert API生成音频,来给自己的视频配乐了。

试听过的友友们这样留言:

音乐由真人谱曲、AI组曲

在演示视频里面,这个text-to-music的AI,实际生成效果听起来还不错。

那不如来看看,Mubert API是怎么工作的吧。

大概的工作流程是这样的:

音乐人谱曲后上传→AI进行风格分类→用户输入文本→AI用demo组曲→生成个性化音乐

也就是说,虽然Mubert API在进行text-to-music的工作,但是AI负责的部分,只有两个步骤:

分类demo + 根据提示文本组合demo成曲。

简而言之,最后生成的音乐,是由真人谱曲、AI组曲

具体是怎么回事呢?

回到第一个步骤,音乐人们制作好demo,上传到Mubert。

采用这种方法,而非AI学习音乐人样本后自己生成新的音乐,是因为Mubert有“从创造者到创造者”的理念。

目前,音乐人们上传的超过150万个demo进入Mubert API的音乐库。

为了让用户们玩得开心,Mubert买下了所有demo的版权。

在线玩耍后生成的音乐,可以免费用来配图或配视频画面。

要在各个社交平台分享的话,务必@mubertapp并带上#mubert话题。

但是,绝对不可以在DSP(Spotify,Apple Music,Deezer等)上面标为原创发表。

至于商用,得是另外的价钱。

Demo上传、入库以后,AI识别音乐风格,将它们分组归类,以便于打标签。

前期工作准备就绪,现在来说说具体操作流程

用户需要输入一句话作为提示文本,再加几个Mubert API标签。

注意,生成音乐的时长可以调节,要不要进行循环、选取哪一段开始循环,也都可以凭你喜欢。

比如宇航员骑大马,配的标签就是“空间”“萨克斯”“旅行”。

这些文本内容会被编码到Transformer的潜在空间向量中,然后,AI会选择那些和提示词及标签最接近的标记向量。

也就是说,AI经过分析后,会选择符合提示文本的音乐demo,把它们排列组合。

如此这般,根据文本生成的个性化音乐,出现了!

值得一提的是,即便输入相同的提示文本,生成雷同音乐的可能性也比较小。

因为所有的音乐,是在提交请求的时候即时生成的,而不是从已有的曲目库中直接拿来用。

一经开源,网友们已经玩儿开了。

日本网友用来生成和风流行音乐(但他也很疑惑,和印象里的日本音乐不咋一样哈)。

当然,也有人尝试了用Mubert API给即将到来的万圣节增加一点恐怖气氛。

也有玩家试玩过后表示,Mubert API在进行音乐生成时,提示文本和标签只能提供一种音乐的氛围,而不能直接搞搞节奏什么的。

Mubert系列

浅看了一下官网,除了Mubert API,Mubert系列还有另外几个项目。

根据既有标签生成音乐的Mubert Render

和API相比,它棋差一招,没办法让用户手动输入提示文本。

但玩儿的人不少,页面上还有很多已生成音乐在推荐位上。

以及,专供音乐人们上传自己音乐demo,赚点小钱钱的Mubert Studio

(你说说,和API形成闭环了不是)

也不复杂,简简单单一注册就可。

还有个叫Mubert Play的App。

你在做运动、放松或者冥想的时候,需要的听歌软件又添一员。

有那么一点小遗憾,除了自行运行开源代码,现在普通玩家还不能玩上网页版。

好在创作团队在Twitter上放话:

Mubert API很快就能够在官网上线!会尽快开发一个简单易用、用户友好的Web界面。

再等等吧!

Github地址:
https://github.com/MubertAI/Mubert-Text-to-Music

Mubert官网:
https://mubert.com/

MEET 2023 大会启动

邀你共论智能产业穿越周期之道

今年12月,MEET2023智能未来大会将再度邀请智能科技产业、科研、投资领域大咖嘉宾,共同探讨人工智能行业破局之道。

欢迎智能科技企业参会,分享突破性成果,交流时代级变革,共襄盛会!点击链接或下方图片查看大会详情:

量子位「MEET 2023智能未来大会」启动,邀你共论智能产业穿越周期之道


点这里关注我 👇 记得标星噢 ~


一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
GENIUS:一个基于“草稿”进行文本生成、数据增强的“小天才”模型扩散模型在文本生成领域的应用坚持自力更生独立自主崛起事实​GENIUS: 根据草稿进行文本生成的预训练模型,可用于多种NLP任务的数据增强这些不当的信念,正在压垮你每天10万首新歌,对音乐行业意味着什么?3D版DALL-E来了!谷歌发布文本3D生成模型DreamFusion,给一个文本提示就能生成3D模型!一文掌握所有命令行,包括73个“冷门但有用”的技巧|GitHub 11万标星之作马克思与皇家卫队 1986伦敦穷游记(7)搞笑图片:现在压弯居然都能摆拍了!虎课 2023 年度周边|更贴己,更温暖,更确幸WAIC 2022 | 澜舟科技创始人&CEO 周明:基于预训练语言模型的可控文本生成研究与应用CIKM2022 | 基于文本增强和缩略-恢复策略的缩略词Transformer基于预训练语言模型的可控文本生成核酸采样舱“变身”发热门诊,从诊疗到配药仅需5分钟NAACL 2022 | 基于Prompt的文本生成迁移学习【祝贺美景上任】《大鱼》UFFC: 北大李法新课题组在压电材料常数测量方面取得突破性进展Meta发布Make-A-Video,这个AI文本生成视频工具太神奇了!压力,来到了房子这边波士顿周边|绝美赏枫好去处!潮起又潮落,回望游戏行业这两年BIE别的音乐 x Le Guess Who?:在荷兰先锋音乐节呈现中国音乐人,在中国呈现全球音乐奇观YY 直播GitHub开源项目,霸屏Github排名榜!Acciona Energía 收购德州最大的电池储能项目张铁生改变了我的人生输入文字生成音乐,这个音乐版Stable Diffusion火了,网友:电子音乐界要被冲击了 | 在线可玩东区节日季活动异彩纷呈, 雪花巷,灯光秀,滑冰场,舞台艺术,现场音乐,亚洲春晚!教培行业这次大概可能真的要彻底玩完了!中文文本生成发展到哪一步了?写方案、写广告的AI全能工具已上线数说银行业保险业这十年与文为伍|音乐行业的破局之道先进IC基板将迎来黄金五年疫中球,诗二首从多篇论文看扩散模型在文本生成领域的应用
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。