Redian新闻
>
大模型又想干掉一个行业

大模型又想干掉一个行业

公众号新闻


最近微信改版打乱发布时间
常有读者朋友错过文章更新
将“智谷趋势”设为星标🌟
保持联系,一起前行

◎作者 | 赵子坤 

◎编辑 | 李   原 

◎来源 | 市界(ID:ishijie2018)已获授权


本已被抖音神曲冲散得七零八落的音乐行业,又在这个春天遇到了更严峻的挑战。最近一个月,轮番上线的音乐大模型,一举将素人生产音乐的门槛降到了最低;并掀起了音乐圈会不会被AI彻底颠覆的讨论。

3月底,Suno V3横空出世,不需要专业的乐理词汇、知识表达,只要输入一个主题,一分钟内音乐大模型就能帮你完成作词、作曲、演唱全套服务。有人向它投喂菜谱、配方说明书,自动生成的《宫保鸡丁》和《连花清瘟胶囊》音乐,听起来也有模有样。

短短20天后,Suno就迎来了号称“强过10倍”的对手Udio。如果说Suno被比作“音乐界的ChatGPT”,那么Udio就是更斑斓多姿的“音乐界的Sora”。它的风格更全面,配唱更专业;并可自由合成乡村、古典、硬摇滚、嘻哈等热门音乐门类。

▲(Udio排行榜推荐歌曲。来源/Udio官网)

功能强大、操作“无脑”,这样的“傻瓜”工具自然会让行业焦虑。“以这个发展速度,AI生产音乐超越现在市面90%以上的作品只是时间问题。”多位音乐制作人如此向「市界」评价道。

精英创企打开头阵,大厂紧随其后。去年Meta、谷歌Lyria已在音乐大模型中排兵布阵;Suno掀起热潮后,昆仑万维天工SkyMusic、网易天音、腾讯TME Studio也先后上线大模型,或在平台上开设了AI频道以带动关注。

5月10日,知名语音生成式AI平台Eleven Labs宣布,将推出文本生成歌曲产品Eleven Labs Music。这家在2022年创立的AI语音合成独角兽公司,半年内估值涨了10倍,现已达10亿美元。

不过,听多了音乐大模型的产品,用户们也很快对这些缺少灵魂的套路感到厌倦。短暂的兴奋后,AI产品的版权归属于谁,创意产业要如何在AI的阴影下生长,都在被更多理性的目光审视。

达到多数流行乐水平


输入关键词,选择喜欢的风格,最短20秒时间,你就能连词带曲得到一首完整的“原创”歌曲。素人用户听来,效果足以“以假乱真”。

3月21日,迭代到V3版本的Suno上线,给人们提供了许多乐趣。平台免费开放,官方将核心用户群对准了没有音乐制作经验的普通人。

几天后,一位B站博主将《连花清瘟胶囊》的产品说明书上传,Suno一分钟内便将其消化,创作出了一首时长3分钟的歌曲,很快上了热榜。随后,用户们又尝试了用重金属曲风爆改《让我们荡起双桨》;用“摇滚加上古筝”的风格写上一曲《醉打蒋门神》,玩得不亦乐乎。

“照这个趋势发展下去,大部分功能性、服务性音乐都能被替代。”独立音乐人崔龙阳向「市界」表示。而只用于商业用途的有版权纯音乐,也被称为“罐头音乐”很可能会因此倒下。虽然AI音乐的音质还达不到正式出版水平,但看起来“这也只是时间问题”。

▲(Suno官网最新热门歌曲及风格)

做电影配乐的小白体验了Suno后认为,除了混音和细节处理外,AI音乐达到了大部分流行作品的水平,“如果不提醒听者这是AI创作的话,很难有人会发现。未来影视配乐行业应该是第一个受到冲击的。”

“最少一年内,最多五年,(AI音乐)就会灭掉罐头市场”,小白说。特别是对于小成本影视剧、小程序、互动小视频等生产者来说,Suno们将能够用极低成本生产音乐内容。

“配乐的流程和技术技巧,比歌曲更趋向于模块化。真要说缺陷的话,模块化处理会带来硬伤,不过应该会很快完善的。我甚至怀疑像达芬奇、protools、premiere等这些音乐软件制作商会直接建立AI音乐的接口。”

不过,更多音乐制作人的态度是淡定和冷静。

3月底,著名音乐人小柯将《因为爱情》的歌词输入Suno后,得到了两首风格截然不同的歌曲,在抖音上调侃自己快要失业了。在其下方一条网友评论得到热赞:“听完觉得您拿的是铁饭碗。”

「市界」在与音乐制作人们交流中,也发现业界主流观点倾向于:对于音乐爱好者、缺少理论知识的创作者来说,Suno是个很好的工具,可以提供开拓旋律、和声、配器等很多方面的思路。但对于职业音乐人来说,AI作曲用处不大。

主要原因在于,Suno不提供分轨,缺少独创性,也存在版权混沌问题。

“生成一个完整的音乐是没有问题的,但是对商业化的东西,比如说做电视剧,OST(主题曲)这些没有太大的帮助。”音乐制作人邓雨鸿玩了几次Suno后就没再打开,他认为,文生音乐的“可控性”太低了,没办法在细节上调整。

而如果仅是给歌曲“套beat(伴奏)”的功能,市面上也早有类似 Band in A Box 这样的自动编曲软件,能帮助音乐人改进工作流程。

特别是,目前的AI音乐的歌词只能输入或者自动生成。“普通人不需要音乐生产,他们需要的是情感能被抒发,被理解。”因此,邓雨鸿认为,Suno只是音乐性和编曲能达到专业的水平,但还做不到回应用户的丰富需求。

“如果说有一个大模型能同时‘扒’出抖音神曲的歌词,对版权音乐可能是更大的冲击。音乐的底层逻辑是一样的,特别是国内的用户90%不是在听音乐,听的是歌词。”邓雨鸿说。

不过接下来,利用GPT-4等工具辅助制作,这个问题或许很容易解决。

“AI降低了玩音乐的门槛,也降低了市场上对原创音乐的需求和工作机会,这些都是事实。未来音乐行业必定会分型——AI音乐及‘人创’音乐。而且,一定会有类似AI机器人概念产品冲击到Live演出、偶像文化等音乐相关的产业。”小白的观点很悲观,“也许几年后就会发生这些事,谁知道呢。”

还只能赚C端的钱


颠覆音乐产业,夺走创作者的生意,并非是Suno、Udio们的创业初衷。Suno CEO兼联合创始人 Mikey Shulman曾表示:他们的理念是让更多人收获创作音乐的乐趣。因此,Suno更专注于创作全新的旋律和人声,而不是模仿已有的知名艺术家声音或歌曲风格。

Suno的名称源于印地语,意为“倾听”。这家成立于2022年的初创公司,旨在推进音乐创作的“民主化”。创始团队只有 12 人,其中4位联合创始人此前都在已被收购的金融数据 AI 科技创业公司 Kensho中工作。最初团队做的方向是音频AI,将上市公司的财报电话会议实时转录成文字。

2023年3月,他们在GitHub上发布了一款名为“Bark”的开源项目后大获成功,从而将方向转为音乐生成。

2023年初,ChatGPT横空出世后,AI生成音频产品和平台的竞争也日益激烈。12月19日,微软宣布将Suno整合到其AI软件平台Copilot中。

去年12月底,为了庆祝《海贼王》动画 25 周年,原作者尾田荣一郎给海贼王官方发送了一首贺曲《YO-HO-HOおれ達海賊》,这首歌曲便是用Suno V2生成——虽然由于成色过于粗糙,该曲遭到了粉丝们的抵制。

4月,Suno又迎来了一个强劲的挑战对手Udio。该团队由前谷歌工程师打造:5位联创中有4位来自谷歌DeepMind团队。需要注意的是,去年11月,谷歌DeepMind推出了音乐生成模型Lyria。贡献者名单上,Udio的4位联创都赫然在列。

Udio 的投资阵容相当豪华,其中包括知名投资机构a16z、Instagram 联合创始人 Mike Krieger、Google Gemini 计划的负责人 Oriol Vinyals,还有一些音乐领域的知名制作人和投资人等。

不过,Udio虽然功能、风格看起来比Suno更加完善强大,但已有外媒报道:网友猜测,Udio的一些高质量音乐可能是与人工歌词结合,并直接抽取了迭代歌曲中的完美桥段生成。

▲(Suno官网会员付费页面)

短时间来看,虽然Suno和Udio已经对音乐人的饭碗形成了威胁,但他们还只能停留于C端,与B端商用还有一段距离。

一方面,AI音乐生产还较为“套路化”,难以为影视等产品提供标准化定制。另外,Suno、Udio生成的歌曲不支持“分轨”,也就是不支持细节修改。如果甲方提出更改需求,生产者只能为其重新生成一首新作品。

因此,目前Suno的盈利模式主要依赖于付费会员。免费会员每天最多生成10首歌曲;愿意支付每月8美元、24美元的付费会员,每月分别可生成500首和2000首歌曲。

目前还在测试阶段的Udio,为了从Suno手中抢夺客户,用户均可免费使用,每人每月可免费生成 1200 首音乐。不过未来,Udio的收费模式或许也将很快上线。

攻陷人类精神阵地


技术革新固然令人兴奋,但随之带来的会是平权,抑或是新的不公?

2022年年底,AIGC的第一枪打向了绘画圈。彼时,画手们对AI作品嗤之以鼻,称其“缝合怪”。如今,人们震惊于音乐制作门槛降低之时,一些熟悉的戏码再度上演,感到焦虑和权益受挫的音乐家们也开始了反击。

“停止贬低音乐价值!”4月2日,包括Katy Perry在内的200多名国际乐坛知名音乐人联署公开信,呼吁AI开发者、科技公司、平台和数字音乐服务商停止使用AI侵犯及贬低人类艺术家的权利。

多位受访音乐制作人告诉「市界」,他们最担心的是,AI无节制扩张会摧毁掉艺术创作的根本规律,打消人类投入学习的积极性。

“以前作曲也好、编曲也好、都需长时间的学习、实践、积累经验才能掌握。一首音乐作品需要一点点打磨、制作上需要投入大量的时间与金钱的成本。AI音乐诞生之后,这些都不需要了。你只需要打打字,叙述一些关键字就可以让 AI 在数十秒内,就创作出一个音乐人花费几小时、甚至几天才能完成的作品。谁还需要努力钻研枯燥的音乐理论和繁琐昂贵的制作技术呢?”

况且,音乐生成大模型的底层素材来源于哪里,是否要依赖于优秀艺术家们的版权音乐进行大量“投喂”训练,也还没有答案。

目前,Suno和Udio均未透露各自的AI系统训练数据,这让音乐版权问题仍处在模糊空间。《滚石》杂志称,有充足的理由认为这两家公司使用了未经授权的、受版权保护的音乐进行AI训练。

与此同时,“急功近利”的AI公司们,也在走向快速商业化变现的道路上。

近期,一方面Suno积极安抚艺术家,给生成音乐主动打上水印,并禁止了用户在提示语中指定艺术家风格,不会使用真实歌手的声音。但同时,Suno也表示:免费用户的创作歌曲版权属于Suno,但付费用户拥有歌曲版权,并可在任意情况下商用。

这对于无需高质量音乐创作的游戏公司、影视创作公司等,无疑是一种利好,AI音乐可能会直接取代音乐外包,为其提供极为廉价的音乐服务。

接下来,抖音等短视频平台用户,小红书等社交媒体用户,是否会开始使用生成音乐作为BGM,短视频平台是否将由此一举解决此前的音乐版权问题,亦都是未知数。

学过8年绘画的小白切身感觉到,身边美术、设计、影视特效行业的朋友都受到了AI革命的影响。自己去年本来打算出版网络漫画,但Midourney等AI绘图软件让他失去了动力。“打个比方,你是一个航海专业的学生,突然有一天发现地球没有水了,所有海洋都消失了,怎么办呢?”

“其实音乐底层的创作技法已经非常多年没有过大的创新和改变了。如果学习的样本足够多,这些技术是可以被学走的。”帮张靓颖制作过歌曲的制作人宋宝宇担忧。

在当下技术发展趋势下,AI音乐对普通听众来说,足以“以假乱真”。“一个事物,如果是假的,就一定可以有办法被辨认出来。但是就怕大家后面懒得去辨认,或者辨认成本太高。”


不过AI浪潮下,也有积极拥抱变化的歌手们。

崔龙阳做过虚拟歌手的声音制作,他提到一些歌唱界“重磅级”艺人会主动提供自己的声源——因为由此会产生单次收益,能拿到版税费。

实际上,此前AI在音乐制作全链条上已有成效。比如唱片正式发布前,AI可以帮忙“代唱”,制作者从中体会不同曲风;或者帮助一些主推虚拟艺人的小公司做定制音源。

头部音乐平台QQ音乐、网易云音乐近期也迅速上线了Suno AI专区,QQ音乐推出了“AI帮你唱”板块。天琴工作室相关人士告诉「市界」,30秒就可以复刻用户声音模型,相似度比较高,1.5分钟出结果。该工作室于2023年推出了“音色魔法师”付费项目,也已取得了不错的收益。

王力宏也是个AI领域新技术的积极尝试者。五年前,他就发布过名为《AI.爱》的探索向歌曲。2023年11月,王力宏授权发布的“AI王力宏”的演出歌曲《Letting go》一度冲上了台湾区排行榜TOP5。QQ音乐上,这首曲子特意被标注为首支“全AI”歌手正式授权发行曲。

“音色很像,但唱法完全不是他的风格。这个声音是他的,但他(本人)不这么唱歌。”一位王力宏忠实粉丝听后评价道,“很明显能听出来是AI在用他音色唱。”

腾讯音乐方面也告诉「市界」,在联络过的艺人中,王力宏的态度是相对积极和乐观的。不过,这样的技术探索仍在初期。“现在没有大面积用起来,音乐人对AI的整体态度比较复杂的。”他们也会主动降低专业音乐人的预期,再三强调是用AI来辅助音乐人,而非取代之。



2024年充满不确定,智谷尽全力帮助你找到有确定性的方向、趋势、研判。加入智谷圈,每周的万字调研和研究,浓缩出高标准的内部研判。


除了每周一篇大事研判,还有资料汇总的圈子,以及每个月一场的闭门直播。想要提升财富认知,从每周一份研判开始。


目前已经涨价到299元/年,我给老读者申请了50个优惠名额,能以199元拍下一年的研判圈,赶紧扫码加入,在圈内等你。

50个优惠名额,赶紧加入
付款后停顿3秒,添加您的专属通信官

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型今日arXiv最热NLP大模型论文:微软发布可视思维链VoT,提高大模型空间想象力今日arXiv最热大模型论文:浙江大学:如何减轻视觉大模型中的幻觉问题AI早知道|元象开源首个多模态大模型XVERSE-V;信通院发布国内首个汽车大模型标准Meta、微软、Mistral AI、Hugging Face、通义、港中文六路进发开源大模型 | 大模型一周大事最强中文大模型又易主了!击败GPT-4 Turbo,首款AI助手发布大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事大模型又开“卷”!万亿参数闭源模型、四千亿开源模型来了第一个倒下的AI大模型硬件创企!Humane被曝10亿美元卖身,曾梦想干iPhone今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意attempt to evidence God? human futile effort今日arXiv最热大模型论文:首个面向AI的python编程框架,提升大模型编程能力新思路国产版Sora到来!视频大模型更上一层楼 | 大模型一周大事企业这12大隐形成本,你不干掉它,它就干掉你的利润!又一个行业,要被AI干掉了?!诗歌皆有来源今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术今日arXiv最热NLP大模型论文:Github万星!北航发布零代码大模型微调平台LlamaFactory给大模型装上眼睛,李学龙团队提出Any2Point,让大模型具备3D视觉理解能力让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述中篇小说:连长(17,结局)200+ 大模型产品全景盘点!探索大模型带来的创新机遇【立即获取报告】二公主姚安娜,爱你呦周鸿祎向李彦宏“开炮”:有些名人胡说八道别被忽悠了;全球最强开源大模型Llama 3发布:最大模型参数将超4000亿丨AI周报阿里通义千问2.5大模型发布;阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉丨AIGC日报不想干?川普潜在副手 捅了一个大大的马蜂窝元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计贴几件普通的衣服,聊个“情绪价值”。卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规今日arXiv最热NLP大模型论文:对指令太敏感?山东大学提出一致性对齐法,治好大模型敏感体质!今日arXiv最热NLP大模型论文:CMU最新综述:工具使用,大模型的神兵利器
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。