艺术家的穷途末路?
插图:老牛
引
近几年因地缘,也因机缘我们二人常见面相聚,每次相聚都会在一种毫无拘束、自由自在的氛围下有一番畅谈,我们称之为“天南海北神聊”,它必有美食与美酒陪伴,即兴也随意。其中一次偶然聊到了当下以人工智能为标志的高科技的迅猛发展,以及其对人类生活方式,包括对各个行业、各个领域的颠覆性的冲击,梁雷教授觉得这是一个非常值得进一步探讨的话题,因为这种冲击显然也会对目前音乐学院的教学体系以及学生,特别是以创作为专业特征的作曲系学生在可见的未来有着直接的影响。如果一个社会变革性的大潮扑面而来,无可规避,那么面对它并对其做一些冷静的观察与思考或讨论无疑是有益的。于是,便有了这次的对话。
与目前正在做开创性跨学科的崭新前沿项目的梁雷教授不同,笔者李滨扬认为自己在自然科学的方面基本上是外行人,之所以讨论几句也是因为平时对当今自然科学的发展,特别是以人工智能为热点的高科技的发展比较关注,谈论中欠专业及外行的地方在所难免。对话中涉及音乐或音乐教育领域的话题,包括对音乐学院教学体制与课程等方面的讨论,可能会让人听了不太顺耳或有不准确、不成熟之处,特在此恭请各位同行能够海涵。不管怎样,如果抛出的话语能够引起同行对该话题的共同关注,那本文的基本目的就达成了。所以,本文称不上严格意义上的文章,我们将之称为“散谈纪录”。
(方便起见,文中梁雷简称“梁”,笔者简称“李”。)
李滨扬
梁雷
并不是耸人听闻
李:上次聊此话题时你提到可以此形成一篇文章,标题就叫“艺术家的穷途末路”。
梁:这个题目特别有意思。我们每一代作曲家的学习环境都在演变,有时是突变。1988年我入中央音乐学院附中,您是我第一位作曲老师。那个年代的中国是一种很独特的环境。之后您和我先后离开北京来美国学习,又是一个全新的环境。学什么?怎么学?我们作为老师教什么?这些都成了问题。现在的学生面临的现实与我们当时面对的截然不同。我教本科作曲学生的第一堂课,所谈的第一个话题就是人工智能,因为这是他们所有人面对的现实。首先得意识到,人工智能突飞猛进的今天也许会带来“艺术家的穷途末路”。对这个没有认识和省悟,往下走就可能是没有方向、没有目的,甚至是没有意义的。
李:现在仔细想想,这还真不是在吓唬人,或者是耸人听闻。这个时代真的是变了,而且是加速度的颠覆性变化。目前来讲,我们还只是进入到一个被有的科技公司主管称之为的“前人工智能”(PRE AI)时代,就是说还没有到真正成熟的人工智能时代。但是,那些顶尖的科学家与高科技公司的主管们已经感觉到担心,感觉到害怕了。特斯拉(Tesla)的创始人与总裁伊隆·马斯克(Elon Musk)曾在一次采访中说他对人工智能的出现与发展深感担忧,他说他曾是ChatGPT的投资人之一,后来因为去做SpaceX(制造开发去火星的火箭公司)而退出了,因此他深知人工智能的可怕之处。他认为人工智能的出现与发展对人类的威胁远远超过核武器对人类社会的威胁。而我们知道上个世纪核武器的出现从根本上改变了整个人类的社会生活,而如今越来越多的拥核国家之间动辄相互核讹诈,核武器就像悬在人类头上的一柄毁灭之剑,随时有可能将人类干掉。记得菲利普·格拉斯(Philip Glass)在他的歌剧《沙滩上的爱因斯坦》(Einstein on the Beach)里就是以作曲家认为的20世纪人类社会出现的三个大事件——进而从根本上改变和影响了人类社会进程——的代表人物作为贯穿全剧的主角,即现代精神分析心理学的鼻祖弗洛伊德、共产主义的斯大林,以及与核武器有关的爱因斯坦。可见核武器从20世纪中期的出现直到当下在人类心底产生的恐惧到达了何种可怕的程度。
1976年,《海滩上的爱因斯坦》在法国阿维尼翁歌剧院上演(视觉中国 供图)
然而,伊隆·马斯克却认为与核武器相比,人工智能在可见的未来对人类的威胁会远超核武器。他认为人脑对知识学习的速度与广度以及储存量都是有限的,一个人不管你有多么勤奋,你多么有知识,你如何广览博学,在AI人工智能面前,都不是一个等量级,完全无法与之相比。而一旦机器学习(Machine Learning)与生成式(Generative)AI的进步达到一定阶段,那么人工智能成长的速度与能力的增长将会是指数性的,人脑根本就跟不上。如果人类一旦对能自主学习思考的人工智能失去控制,其后果将不堪设想。这一点,著名物理学家斯蒂芬·霍金也警告人类:人工智能是“我们文明史上最糟糕的事情”(“Worst event in the history of our civilization”);人工智能“甚至会毁灭人类”(“Could spell the end of the human race”)。
记得在十多年前,我给大学本科学生上大课,讨论调性解体时提及现代科技特别是互联网的出现对人类社会生活方式的影响,以及对艺术及其表现手法的影响,跟学生们谈到我自己的感想与看法,即以互联网、电脑、智能手机等为标志的现代科技的出现与普及,已经彻底地改变了人类的生活方式和生活习惯,包括我们的艺术创作与欣赏的习惯与方式,我们身处一个与以往完全不同的崭新时代。但是,我认为这一切都还只是刚刚开始,不远的未来还有颠覆性的、更令人震惊和激动的高科技出现,以至于会将人类社会带到一个天翻地覆的无比先进的社会生活环境里。
不过,当时我对进一步改变人类生活的颠覆性的令人震惊的高科技是什么、将以何种方式出现以及何时出现则是完全茫然,直到人工智能的出现。
梁:比我们想象得早,已经来了。
李:对。但是很多人在此阶段并不太了解人工智能所蕴藏的巨大能量以及它在未来可能会给人类带来无比的便捷的同时也带来致命的威胁。几年前就陆续传来马斯克在做一个人脑神经链接(Neuralink)的项目消息,即将某种芯片植入人脑并与电脑相连接。当时觉得马斯克又在搞怪,异想天开。后来对这个项目有了一些大概了解,特别是在观看了马斯克在一次访谈中对该项目做出的阐述与解释后,才基本上搞清楚他做这个项目的初衷与本意。他表示,Neuralink项目的早期目的聚焦在治疗人类脑部疾病如老年痴呆症以及其他一些疾病如瘫痪等,但该项目的核心目的是要通过脑植入芯片与电脑连接后,使人脑的能力得到提升与增强,这样当人工智能在发展的过程中,人类能够加入这一旅程而不至于被落下。在前期的鼠、猴、猪的实验后,该项目已于2023年5月获得FBA在人体上做实验的许可。
且不说人工智能到底会发展到哪种程度,光是马斯克这个芯片植入的人脑神经链接Neuralink就如同将科幻电影里才发生的情节直接搬进现实生活,如果它成功了(马斯克经常说自己喜欢做别人认为不可能的事,而且,几乎都能做成),人类生活将会发生什么 天翻地覆的变化?仔细琢磨,好像怎么夸张都不为过,它恐怕将会从根本上颠覆我们目前的社会生活方式和构架,将会直接涉及社会的各个层面和各行各业的存亡。而这仅仅是为了对付可能的人工智能超越人类的情况发生。所以,未来人工智能给人类带来的剧烈冲击与变化的说法应该不是耸人听闻。至少从马斯克所采取的上述行动来看,它成为现实的可能性极大。
不得不提及一下的是,人工智能也只是当今高科技在各个领域飞速发展的一部分而已,尽管它终将浸透到几乎社会的每一个角落。而我们耳朵里近年来还充满了关于量子计算、基因生物科技、可控核聚变、常温超导等种种信息,这些都是当今革命性的研发领域,任何其中一项的研发成功对人类的影响都将是巨大的。我们能看到众多高科技公司都在异常激烈的竞争中力争脱颖而出,都企图以革命性的成果彻底改变本领域之现状。而且,在2023年的今天,上述不少领域的研发似乎都出现了成功的端倪,难怪有人说,似乎人类历史的Singularity(奇点)真的要到来了。
有时朋友间调侃:系好安全带,人类历史的过山车恐怕随时就要启动。
2023年7月14日,美国影视演员协会(SAG-AFTRA)发起罢工,事件持续数月,图为影视从业人员高举“罢工”标语牌游行示威(视觉中国 供图)
谁都不会置身事外
李:早些年谷歌的阿尔法狗(AIphaGo)打败世界围棋冠军引起轰动,人们(比如我自己)只是好奇而已,而个中的潜在意义则浑然不察。
而今,ChatGPT以及更多的AI产品的出现直接与人们方方面面的生活工作连结起来,这一次感受就比较真切了。
比如最近好莱坞编剧协会与演员工会大罢工的矛盾爆发点之一就与AI有关。
梁:这件事说明AI已经直接进入艺术创作领域。语言比起图像、声音更容易被数码化、被复制,语言的规则比起音乐的规则(如果是有规则的话)毕竟简单多了。因此,AI对好莱坞的编剧协会成员们的冲击最早。
2016年,围棋选手李世石与谷歌开发的计算机程序AlphaGo进行了五局比赛
李:是。面对AI,编剧和演员们担心它的崛起会取代其工作,具体讲就是担心AI的入侵渐渐进入到影视制作的核心范围,出现包括剧本写作、编剧、影视拍摄以及演员们的生存空间被挤压的局面。
冲击是显而易见的。设想一个具有深度学习与生成式功能、储备了影视史上所有作品全部信息与参数的人工智能大语言模型(Large Language Model)要根据所输入的要求而产生一个剧本是一件多么容易的事情,数十分钟甚至更短时间就可以完成。长此以往,很多剧本创作人员恐怕就要歇息了,生计难保。再就是在AI技术的参与与推动下,非真人演出的影视作品从电影到电视剧越来越常见,这对那些演员来讲不是个好趋势,这种影视作品越来越多,对真人演员的需求就会越来越少。
单个人的进步与AI发展的趋势相比会显得越来越弱小,如上面提到的谷歌阿尔法狗的阿尔法狗零号(AlphaGo Zero)在训练自己时,仅在头三天就与自己下了四百九十万场棋,这个数量级如果是单个人就算是天才,终其一生背棋谱背再多也无法与其相提并论,胜算渺茫。
最近媒体纷纷报道日本福井县两位学艺术专业的青年人轻生未遂的事件,据当事人讲出的原因就是觉得自己的人生被AI毁了:比如自己辛辛苦苦花了数月构思创作的绘画作品用AI十来分钟就完成了,并且还非常精彩,因而感觉无力与其竞争,很绝望,看不到前途。我自己身边也有极具天赋的油画家在看了AI创作生成的油画作品后产生了类似的绝望情绪,而且想就此放弃创作,也说看不到前途。为此,我去查找了一下AI的绘画作品,看过后也觉得十分震撼。如此真实、完美、生动,很难想象与相信是出自AI。
由AI创造人的形象,其中只有一个是真人,其余三人是AI创造的
梁:这里我们可以展开一下,人工智能绘画我看得很少,但我注意到一个材料讲AI创造人的形象的作法。它是采集很多不同人的形象,然后把它们综合起来,创造出来的形象往往比真人更完美。这就有一个问题:当你这么做出来的形象,它比真人更完美的话,那真人是什么呢,真人是不完美的。真人有很多瑕疵,这些瑕疵是“真”的重要元素,甚至恰恰因为瑕疵而真实。这个真实本身类似在电话里听到的噪音、信号里的错误、我们谈话中的一些误读等,各种各样的不完美恰恰构成了一种真实的存在和体验。艺术作品也是如此,不完美与瑕疵其实也是其重要特征。机械性“完美”则造成虚假。另外,视觉上的复制容易过于依赖对所谓“美”“色彩”“速度”的诱惑和刺激。这些多是机械性、表面的模拟,是技术带着人走,而不是创作者走在技术前面。
2022年4月23日,全球首个超现实人形机器人艺术家艾达在威尼斯双年展上以艺术家的身份举办艺术作品个展,这是双年展120年历史上首次机器人与人类艺术家共同展出作品
李:是的,我们现在看到的AI创作产生出来的作品基本上都具有你说的这些特征,由于其太完美而与真实的人与物有较为明显的距离与区分,这也为真人从事的各种工作与活动留下相当大的想象与操作空间,亦显示目前AI在这方面仍处于不成熟阶段。不过,这种不成熟阶段大概应该不会持续很久。在众多高科技公司激烈而疯狂的竞争开发下,AI照目前这个速度发展下去,应该可以预见将会以非常快的步伐成熟完善起来。如果一个足够大的、有着特别厉害的算法构架的生成式人工智能大语言模型能够将某学科的所有有可能存在的参数,也许是百亿、千亿甚至是万亿量的参数都收入在模型内的话,在特定指令输入后所生成出来的结果一定是惊人的。在这一波由ChatGPT带起来的AI热潮中,各大科技公司都迫不及待地推出了自己的AI产品,如谷歌的Bard、亚马逊的Amazon Lex、派能梯尔的AIP等等。而ChatGPT也在很短时间里更新升级从1到了4。这些都似乎让人们突然发现原本模糊不清的AI说话间就到身边了,其成熟度也是令人印象深刻。
现在,轮到政府不安了。AI的迅猛发展在给人类带来便利并可预见地要引领人类进入一个无比发达的崭新时代的同时,也猛烈地冲击着现时的人类生活秩序特别是法律体系与道德规范:对AI的任意使用的一个可能的结果就是造成人类社会在法律体系与道德规范的混乱甚至溃乱与崩塌——如果没有相应的立法与各种技术手段跟进的话。这就是为什么前不久美国政府将七大科技公司CEO招进白宫共同商讨对策。
梁:这个消息我也关注到了,将那些高科技大公司的主管叫去开会应该就是说AI的事。
2018年10月22日,纽约佳士得拍卖行以约合人民币301万元的价格拍卖了一幅由AI软件绘制的肖像画《埃德蒙·贝拉米》,这也是人工智能绘画第一次走进拍卖行(视觉中国 供图)
李:好像是在这次政府安排的商讨上,各大公司主管做出承诺,凡是由本公司AI产品所生成的任何出品必须要有本公司水印标注,以防滥用,造成混乱。
有专家说:从社会经济学层面上讲,一旦成熟的机器学习与生成式AI的成本降低到全社会普遍性可担负的程度时,一个新世代即宣告到来。人们进入一个无比先进而便利的时代,但其冲击力也是剧烈而全面的,几乎无人能置身于这个时代之外。很多传统或现存的行业会消失,很多岗位也会消失或被取代。音乐相关专业、特别是从事音乐教育事业的人士在这个浪潮之下受到冲击恐怕也是在所难免的。
2022年7月20日,初创公司OpenAI向100万人开放其人工智能软件DALL-E,该软件可以通过简单的口头指示创建图像,图为该软件通过指令生成的图像“骑马的宇航员”(视觉中国 供图)
AI与音乐创作及音乐教育
再回到我们之前提到的艺术家的穷途末路。其实,之前的好莱坞与日本青年画家的例子就是在聊艺术家。现在聊音乐,就以音乐学院为对象来聊聊,我们可以将其简单地剖析一下,探探它的本质是什么。音乐学院别的系我们暂不说,比如演奏专业,其专业本身应该暂时不会受到大的冲击,在相当长的时间内难以被取代,还可以存活下去。当然不是说没有冲击,这个可以留在以后聊。我们只说说我们熟悉的作曲系。
我国的音乐教育体系基本上是西式的,就目前音乐学院的基本构架来看,它的学制,它的分系的方式、专业的设置、课程的设置、教材的使用、课堂集体大课与专业个人单独行课方式等等,基本上是仿照欧美同行的。与所有其他门类的教育实体如各类大学等相似,组建这种结构体系的最基本的目的可以用大白话四个字概括:传授知识。那知识的本质是什么呢?
作曲系将学生招收进来,为其设置了著名的五大件,即和声、配器、复调、作品分析,再加上作曲主科。当然还有一些其他的辅助课程。这些课程虽然类别不同,但其目的显然都指向同一个方向:尽可能多地将整个音乐史上的经典作品以及眼下的新优秀作品进行全方位的学习与研究分析,以从中获得包括技术在内的各种直接对作曲创作有针对性用处的知识,同时根据学习进度尝试运用所学相关专业知识在主科课上进行训练性创作。
学生从进校那天开始就被要求尽可能多地聆听并浏览分析各个时期的经典作品,聆听各种音乐会,以至于作曲系近年在研究生与博士生招生考试中设置了看局部乐谱辨认作曲家作品的环节,以考察考生脑中的作品的阅览积累的广度与深度。
几大件技术课程即和声、复调、配器、作品分析的教学内容基本上由两大部分组成:以调性音乐为主体,以调性后非调性以及其他非典型性近现代音乐为辅或补充。各门教材上的技术与理论的形成几无例外地来自对大量已知经典作品在不同层面与角度的表象上所呈现出来的逻辑性与规律性的归纳与总结。教学的核心聚焦在两个字上,即解构。将大量不同时期、不同风格、不同体裁的经典作品进行层层拆解,从整体、宏观结构上拆解成大部分,再拆到次级结构,再到乐段、乐句、乐汇,直至拆到最小元素单位的动机。
解构的目的是什么呢?作为一个想要成为优秀作曲家的学生,音乐学院要求你去了解那些文献,了解那些经典作品的作曲家是如何做的,了解不同时代不同风格的作曲家作品为什么不同,比如肖斯塔科维奇是怎么回事?理查·施特劳斯又是怎么回事?他们的作品为什么不同?他们有哪些区别?他们各自对声音的想法和追求落实在谱面上的差异背后是什么?他们在构思上、在材料运用上和处理上有什么不同?他们在作品中是怎么处理安排不同层次、不同阶段各种元素相互之间的关系的?
解构的目的就是要让学生们去了解那些文献和经典作品背后存在的所有参数与信息,并且在各个注重不同侧面技术课的辅助下掌控那些具逻辑性、规律性、内在关联性与经典性而形成的可供自己创作所用的参数与元素。如要称之为技术也行。
和声课会从纵向角度去研究该作品音与音纵向组合之间的关系与运动方向及布局;复调课会去研究作品中不同线条之间的对位关系以及运动方式;配器课则是在乐队作品中研究不同乐器的不同组合方式所展现出来的各种音响与音色;作品分析课则是对作品进行剖析,包括从整体结构布局与运动方式到不同次级结构与运动方式,直至最小原始材料的动机以及最基础的音与音的安排与运用,涉及调式调性或材料布局、力度、速度、表情、演奏法等全部元素。
2023年,第二届世界音乐人工智能大会在北京举行。一场“未来音乐会”是本次大会的亮点,图为机器狗出现在演奏现场
学生在通过四年(第五年用来创作本科毕业乐队作品)的各科课程学习后获得了创作一个包括各种体裁与结构在内的音乐作品所需要的基本知识与技术,这些知识与技术是系统性的、全方位的。学生们知晓了各种材料与元素以及各种技术手段在不同的层次、不同的结构、不同的阶段的功用与意义,以及如何在实际创作中根据自己的意愿去使用它们,进而创作出自己想要的音乐作品。至此,音乐学院作曲系大学本科教育阶段的知识传授过程完成。
但是,我们仔细想想,整个这种教育体制,这种教育方式与过程,说到底了,它背后的根本目的不就是为了相关参数与信息的获得与掌控吗?(梁:对的)我们刚刚提到的音乐学院存在的本质,也在于此。
而所有的这些参数与信息都可以在AI中量化并建立相互关联的深层逻辑关系。比如我要表达悲伤,要一条悲伤的旋律,那旋律是什么?哪类旋律是悲伤的?哪类旋律是欢快的?悲伤又有各种不同悲伤,拉赫玛尼诺夫有拉赫玛尼诺夫的悲伤,柴科夫斯基有柴科夫斯基的悲伤,其实它们背后都是有各种各样的具体参数的,AI都可以根据所存参数通过自己的方法将之做出来的。
快要说到痛处了。音乐学院通过它的教育体系将培养一个学生所需要的系统知识传授给学生,使之成为一个作曲家,然后再将这个作曲家输送到社会去。这个作曲家脑子里储存的关于作曲的技能基本上就是那些在音乐学院被传授或者是其间通过其他渠道获得的知识,这些知识的本质,就是各种与音乐及创作相关联的参数与信息及各种组合。如果咱们再类推远点说,在任何教育系统里传授的专业知识的本质也是各种与该专业相关联的信息及各种组合。
那么,问题来了,这套教育体系在AI时代怎么办?少数人,像你这样(指梁雷)的尖端大师级别的作曲家在学院里探索最前沿属于自己的新路,没问题。但社会所需音乐包括各种商业音乐,绝大部分都是调性音乐,很容易用几个简单指令就可以通过AI获得满意的结果。而音乐学院作曲系通过五年(或之后再读完硕博)培养出来的学生毕竟大多数是要被推入到社会上去的,不可能全都留在学校当教师。我现在不好说未来会变成什么状况,但有一点可以比较肯定的是:在AI时代,社会对这些毕业学生的需求不大。
梁:首先从经济成本来看,这种投资不值得。一个学生花四年的时间来学习本科这套东西,这四年学出来所能达到的程度,远远不及现在的AI。它可能几分钟甚至更短时间就可以解决问题,而且AI远远更廉价。
当然,发展AI对自然环境的影响,尤其是释放二氧化碳的可怕程度,以及对锂等稀土元素开采的依赖而带来的自然破坏,还是最近才被人们逐渐意识到的。这将是另一种成本,而且是一个极大的成本,整个人类都需要面对。
李:对,一旦有了音乐的人工智能大语言模型,根本性变化就近在咫尺了。比如中央音乐学院建立了一个音乐人工智能系,但我不知道他们目前是在做什么,是在哪一个阶段上,是在建立大语言模型还是在做其他什么。如果要做一个大语言人工智能模型,除了需要海量的参数外,最重要的是它构架之下的算法。本人道听途说,最牛的算法背后都有很厉害的数学家的加入,对此,不知真假。此外,还需要非常强大的电脑系统做数据的处理,这是当然的。因此,要从最简单的参数穷尽法一步步发展到深度学习(deep learning),再到生成式AI(generative AI),各种难度很大,情况也很复杂。音乐学院人工智能音乐系的情况我们不了解,就不妄加猜测与评论了。
说到算法,叫algorithm吧?
梁:是的,是algorithm。
本组图片是由梁雷指导、视觉艺术家程铭泳采用地质学家Emily Chin提供的真实矿物图片数据集,通过生成式AI技术创造的作品
李:在美国音乐界,上世纪60年代就有人尝试用算法作曲,而且记得此人还是一位数学家。尽管可以肯定的是,那时的算法应该是很粗浅的,但我们仍可以从中一窥音乐界的先辈的创新探索精神。
梁:有些人是从理论着手,比如判和声题。我们是知道该怎么判题的,如平行五、八度之类的,但电脑程序判得比我们快,而且比我们更准确。所以你跟机器来合作,它比我们老师更有效。这就已经引发到了它所能掌握的不同时期音乐语言的数据和梳理的程度,可能远远超过我们。这是肯定做过的。我的一个好朋友迈克·卡思伯特(Myke Cuthbert)教授在MIT(麻省理工学院),当时就在领头做这件事。当然在圣塔克鲁斯(Santa Cruz),大卫·科普(David Cope)教授用电脑模仿不同时期的音乐,如巴赫、贝多芬等作曲家的风格。他不光是以假乱真,甚至还可以比赛,比赛时你不知道情况,听众来评分,把真的巴赫作品与假的混在一起,最后听众给了那个假巴赫作品更高的分。这个已经在上世纪80年代做出来了。在这个框架上,现在从量来讲,各个时期、各种风格,甚至不同文化的音乐数据都在不断扩充。这引发我们去想,我们培养人才的目的、服务社会的功能,是否都可以用机器代替解决。同时,还有一个重要的问题是,人工智能所依靠的数据,大多是符合西方体系框架的,比如可以用记谱、音高、和声、对位、配器等方法来表述这个创造,也就是复制过程。但这只是一个体系。这个体系以外的大量的世界音乐文化,无法用这个体系的坐标来简单表述自己的特征。您刚才提到“音乐的人工智能大语言模型”。我们得问自己,“这是谁的语言模型?”
我们还可以想:什么东西是我们做艺术的理想?我们还可以做什么?
大卫·科普
李:是的,我们还留有什么空间可以施展?我也在想这事。起码,从现在这个阶段来讲,应该还有空间。因为这个人工智能还没有发展到那么成熟的地步。就是说:我们人所能想象到的机器不一定能想象到,看看我们能不能做到可以去另辟一个空间。但是一个可怕的可能是:当你去开辟另外一个空间时,AI会追踪你的方向,它会跟随你,学习你空间的一切,然后做得比你更好。难怪伊隆·马斯克那么惧怕AI,觉得是件很恐怖的事。当然,目前来讲,因为AI仍在早期阶段,说实话,包括我们自己做音乐的人都没有那么强烈地害怕自己的什么东西会被取代,我们有点不相信。或者说因为没有见到过,也就没有深切体会。但是,我觉得现在对我们来讲,正如你选择的方向就很好,就是说:我们尽量去寻找一种非常规的思维和路子这么去做。美国有特别多的科技公司,在这样一种环境下大家都可以任意去想,任意去做。它们的发展都非常快、非常厉害,包括在金融方面,在高科技方面与生物生命科学方面都在拼命地搞科研开发,它们始终在想怎么做到destructive(毁灭性?),就是琢磨着要把现有的东西给毁掉,然后用新的取而代之。比如眼下最热门的几个领域如人工智能、量子计算、生物生命科学等,真的没想到都发展得那么快。每个人都想去旧换新,都想做颠覆性的事,做破坏性的事,都想做game changer(改变游戏规则者)。
梁:Paradigm shift(模式转换)!
2021年9月2日,瑞士管弦乐团演奏《第十交响曲》向贝多芬致敬,该曲谱由AI续写(视觉中国 供图)
2021年9月2日,贝多芬《第十交响曲》的计算机程序设计师弗洛里安·科隆博(右)和指挥家吉约姆·贝尔尼(左)正在研究乐谱(视觉中国 供图)
李:对头。所以,这个时代会变化得非常快。但就我们自己面对的现在这些新事物来说,我们所能想象到的、所能理解的很有限,因为我们并不是专家。你(指梁雷)在这方面比我好,我只能说现在在我们眼皮子下已经正在发生的事物以及我们已身处在这个环境的时候,我们有时候可能会要做一些反思,做一些思考,也就是这样了。因为这方面说实话比如我自己,在这些技术面前就几乎是一个二楞子,并不是系统性地懂很多或者很深入地了解很多。仅是凭自己的直觉,凭一个艺术家对这个社会的变迁的敏感,对这个世界的技术的发展以及这些技术发展背后所可能带来的你意想不到的变化有一种类似第六感的东西。
梁:有敏感、有直觉,这是一种intelligence(智能)。它是人类的一种智慧的潜能,在这种压力下面,在这种新的环境里面,这种潜能可以被激发。
李:有时真的是一种直觉,就如我上次跟你提到的那家公司,到现在华尔街以及好多金融分析家依然不买它的账,当时凭直觉,觉得这个公司做的事很厉害,并且觉得那些行之多年的Excel、Word、PDF等东西只能是早期产品,它们迟早会被颠覆性技术所产生的东西取代。现在看来好像还真是如此,目前它在AI界的领头地位已逐渐显现出来。我们还可以继续观察下去。前不久,它的CTO(技术执行官)在国会听证时说了一句令人印象深刻的话:The future is here,you adopt AI or you will fail(未来就在这里,你接纳AI,否则你将会失败)。
第二届世界音乐人工智能大会“未来音乐会”中,“数字人指挥家”与中央音乐学院交响乐团成员合作演出
梁:我们再说一个具体的问题,比如您最近写的一个叫《云涧赋》的作品。我们现在创作时,等于不断要和AI这个环境对话。AI随时都可能是我们的合作者或者是我们的竞争对手。在这样的环境中,我们在创作的时候怎么给自己定位?从哪些地方去下功夫?比如说您创作这首作品的时候,AI成为一个背景的噪音,整天想着这个事情,但您在进入到创作的时候,哪些地方作为您的着眼点?
李:这个作品的英文名字还是你帮我取的,非常感谢!不过这个作品在写作时还真没联想到AI,因为音乐会主办方有比较具体的要求:可听性。就是说一般听众可以接受的东西就是他们平常比较熟悉的东西,那这些东西都是比较普通寻常的,你用的材料与技术以及表现方式也就没有多少新异,完全有可能都在AI的参数囊括中,当然这个问题还可以进一步商榷。我没有挖空心思去寻求个性在作品中的发挥,只在有限范围里争取做得有意思一些。退一步说,就算我去挖空心思去写出来了,这类作品的这种效果对AI来说,也是无所谓的。它完全可以做出来比你更漂亮的东西,就这么简单。只能说这一个作品打上了我的标签,它不是AI做出来的。它有它一定的价值。所以我说我们还可以做一段时间,再往后面怎么做我不知道。一旦你把它创作出来后,它是空前的,但它绝不了后。就是说,你今天做这东西出来,以前没人做过,连AI也没有做过。但这类东西一旦做出来,就会有人(AI)做得比它更好。你可以把它打上标签,说是某人写的,写得很有意思,很精彩。但是这种东西,在成熟的AI面前,就我的理解,越往后走,AI可以做出的更好的东西就越多。
这里我拐一个弯,来看看这个时代的发展和社会的进步,以及选择与被选择问题:记得“文革”时期的八个样板戏,人人都认为每一个作品都是精雕细琢的精品。比如我的导师杜鸣心先生他们创作的芭蕾舞剧《红色娘子军》,从整体到细部,每一小节、每一个细节都是一帮人精心设计、精心推敲、不断改进而成的。所以前些年有人跟我感叹说样板戏是如何如何的好,现在已没有更好的能与之相比的作品出现了。我说你这个看法错了,当年的样板戏从技术、从音响上的确是精品,艺术家们如杜先生等真的是才华横溢,时至今日,杜先生以九十有余的高龄仍在勤耕不辍,仍是国内作曲界高山仰止的存在。不过经过几十年的改革开放,众多艺术家创作出很多文艺作品,有很多作品从技术、艺术、艺术家的才能等各个方面来看都不逊于当年的样板戏,而且客观地讲,有些作品水准更高。江山代有人才出,时代毕竟要往前走。
但是,为什么这些作品没有流行起来?为什么没有人去听呢?为什么不为人所知呢?那是因为特殊的历史原因,那个时候只有八个样板戏,全国几亿人只能听、只能看这些样板戏,没有选择、没有对比。这种强制性给那个年代的每个人心里都打上了深深的烙印。但是后来改革开放,当大量作品涌现出来的时候,也正是信息爆炸的时候。太多的作品,选择太多,人们都不知道该听什么。其实这里面有时如果你随手拿一个现在的作品,如舞剧、歌剧或其他什么种类的作品你仔细听听,也许你会发现真的很不错,真的不比那些样板戏作品差。但是它们已经被大量的作品埋没了,现在创作产生的作品数量之大,种类之多,你都不知道是多少。再一个就是由于现今科技的飞速发展,人类欣赏音乐、欣赏艺术的方式、手段和途径太多了。所以有的作品甚至演出一次就搁那儿了,下一次演出不知道是什么时候,而且即使再演也多限于小圈子里面。其实它们当中的确有很不错的作品,不管是从艺术上还是从技术上都不亚于样板戏作品。我近些年在国内还真地听了些写得很精致甚至堪称经典的作品。但它们在整个社会里还是传播不开来,甚至基本不为人所知。
梁:AI时代很可能会更大程度地造成人们对音乐史的误解和扭曲。好作品会被淹没(李:对),以至于后来我们作为研究音乐的人可能要重新去发现它。就说在亚马逊Prime的Alexa里,你想要听音乐,它就给你播放乐曲,但是它提供的选择是非常有限的,甚至是误导的。它的所谓好坏取决于数据。数据上很多人听的东西不等于是好东西。我们搞音乐的人懂是哪部作品、什么乐器、什么风格、作品的质量、演奏家的诠释水平,等等。在这方面,亚马逊Prime等还远远不够令人满意。
有音乐史训练的人都应当知道,历史是人造的,是不断被重新发现的。真正好的东西不一定与数据成正比。巴赫被忽略、被遗忘了多少年,才被重新发现?AI有可能在更大程度上会淹没好东西。大量信息是噪音,AI会带来更多这样的噪音。甚至可以说,AI对音乐的判断被简化为数据——关心的核心是多少人听、多少人点赞——其结果是对平庸的美化。
李:证明他们的参数有限。
梁:还是极其有限。也有经济问题,比如说它这个公司能够提供什么,如果人家不跟它签这个合约的话,它就拿不到这些东西,所以我们的听众可能会误解它提供的就是最好、最权威的东西。
李:所以,你说的这个情况就变成或者说明了一个问题:这种AI在建模的时候有真知灼见的艺术家参与其中是多么重要。
梁:太重要了!
你把那些参数输进去,它的好与不好,高与低的标准,一定要有一个专业的、高水准的、有真知灼见的、客观公正的评价来定位。通过艺术家的评价与定位,再通过扩大到足够量的这个AI模型,把真正的好东西推荐给专业人士和大众,这样甚至可以从某种程度上讲起到对一般公众在音乐上认知的启蒙作用。
梁:就像当初的巴赫,要通过莫扎特、贝多芬、门德尔松才把他重新发现,再现给听众。
李:这就是AI的一个积极的方面,对人类文化生活的一个积极的方面。
梁:音乐家受教育阶段如果能够跟AI合作的话,可以把AI作为助手、作为合作者。然后就是对音乐普及。还有一种我在想就是,你身处现在这种环境里面作曲,同样在音乐学院,有没有必要重新界定——什么样的教育目的能够回应AI这个环境?
李:这是point(关键点)。
梁:就是说我们在穷途末路中来找到我们的路在哪儿。
李:对,所以我们现在关切的是什么?关切的是目前现存的东西它以后该怎么办(梁:对)?这到底有用没用啊?你用了四年时间把那些知识往脑子里面装,然后还赶不上人家一分钟出来的东西,它比你还全。
梁:还免费,谁都可以用它。那么,现在就非常具体了,音乐学院怎样重新定位?
李:现在音乐教育的方向在哪儿?
梁:我们过去教的东西AI已经能做到,那我们到底要做什么,说是给学生教育,这个教育将来他们有什么希望?
李:我们讲的核心就在这儿,因为我们是做音乐的,是作曲的,我们同时也在从事音乐教学。目前来说不管是东方还是西方,教学体制的框架都是差不多的,所遇问题也是相似的。
梁:所以这是一个特别的、我们必须要问自己的一个问题。否则的话,不要想是教学了,也不要想是办学了,那音乐学院在当前的大环境下,国内青年人的失业率已经很高了,整体压力非常大,对学音乐的学生来说,社会需要什么,这一点很重要。我们的学生所面对的那个社会所需要的音乐已经不是我们过去定义的音乐了。
李:你说得太对了,就是这个意思。
梁:那么现在要想:什么音乐才是定位给未来带来希望的音乐?AI已经能做很多我们已经做好了的东西,并且很快会比我们做得更好。但是我们要做什么东西是走在AI前面的?至少走在前十年、二十年也可以。
李:这就可以转到你那条路上去了。其实当我们有这种关切以后,从某种角度上来讲大家都觉得比较盲目,但是又有一种强烈的感觉要找一条新路。
梁:或者至少是几条吧,咱们不说是某一条。
李:当然不是某一条,而是每个人都去找属于自己的新路。就像你现在找你的新路,每个人都找自己的新路。但要找这个新路,说实话,比以往更难(梁:对)。你会碰见一个无处不在的对手。你刚一出现,它啪一下就站在你的对面了,你刚在另一个地方出现它立马又站你面前了,就成了这种情况。其实我觉得这也是一件挺有意思的事。
乔姆斯基
梁:一种思路是:什么东西是它们AI能够复制的?乔姆斯基在今年(2023年)3月《纽约时报》上的一篇文章中说:“我们不要称AI为‘人工智能’,而应称其为‘抄袭软件’,因为它不会创造任何东西,只会复制现有艺术家的现有作品,对其进行修改。”因为AI是在已经发生的、已经有的基础上复制得更好,但是哪些是创新的?这一点我们可以有不同角度的理解。乔姆斯基所指出的一部分是技术问题,技术也在不断演进。同时我们必须反省的是,人也不一定真正创新。我们说“发表重复观点”甚至“抄袭作弊”,其实是很多所谓艺术家与学者在机械性地重复他人,也重复自己。比如我们在各种作曲评比中可以看到,大多作品也是模仿、用不同方式复制现有艺术家的现有作品,尤其是模仿西方作曲家,甚至是东拼西凑。“创新”一直是让我们困惑、无论对人还是对人工智能来说不断追求的理想。这些没有创新的艺术家与学者在AI面前找到了真正的对手:AI是最高效的舞弊抄袭工具。
这个时代,我们给“创新”的定位可能完全是新的。过去我们说音乐语言创新,这是一种思路。但此时是在一个更大的视野下面问这个问题,比如说音乐语言的创新,我们不能只在线性的思维以内、在西方的这个结构的思想音乐理论里面,而是要在一个更大的框架里来考虑这个问题。
李:你说的这个问题我也想过。一个人他在创作的时候,是基于他的出生、他的内心的文化沉淀、他的知识面、他的知识结构、他的思想深度、他的社会经历、他读的书、他观察世界的方法、他的个性、他的创造性的想象才能等等,在这所有的基础上他去想象、去联想,他去调动各种组合的可能性,各种可能产生的跟他所具备的那些基础看起来毫无关系的想象,但这个想象出来的东西在最底层上又跟他具备的那些基础是有关系的。在这个过程中,他还有一个重要的事从头到尾都要警觉,那就是尽量回避那些他之前已知与熟悉的东西,以免雷同。那么,这个就是我们讲的一种创新,而每个人所想象出来的、所做出来的又各有不同。刚才你问我刚完成的《云涧赋》,那肯定是属于我个人写的东西,写这个东西的背后就是我刚才说到的那些因素在起作用。但这里有另外一个问题:现在的AI它有深度学习、自我学习的功能,它可以做prediction(预测),它可以根据它所掌握的资料数据去做结论,甚至做某种生成式联想,也可以做创作。当然,但愿是它走它的,我们走我们的。相信至少目前人类所有的某些东西AI还不一定具备。
蒂娜·塔隆
梁:我有一个博士学生蒂娜·塔隆(Tina Tallon)在佛罗里达州州立大学的AI研究所里任教。学习作曲前,她是在MIT读生物学的,两年前获得了“罗马大奖”。这种对话如果再加上一个她这样背景的人就更有意思了(李:这个很有意思),她最近还有一个《纽约时报》对她的采访。有她的加入的话,这种对话就可以更展开。AI本身要追的还很多,但是我们现在在想,比如你刚才说的每个人的创作它是一个整体,是多年多方面的积累,包括人生体验的积累(李:对),然后通过创作把它联系起来,爆发出来,做成一种新的表达。现在我们可以考虑在音乐学院,不管将来叫什么了,作为音乐学院,它的一种理念是,在创作的时候它可以把这个整体(包括AI)作为新的模式。一个人在这种环境里面,他需要一个什么样的整体的数据,还有就是他的体验还是一个非常“人”的特质。
李:非常个体化的。
梁:个体化的东西,对。我在想:比如你在美国观察,现在走到这一步,想创作出来有意思的东西,无论是在中国还是在美国,它需要在什么样的一个更大的环境里面给人带来更广更深的积淀,所以他能创造出来的那种联想,不同的穿插。这个现在成了我们教育必须做的事情了,因为如果只是四大件、五大件的话,那些数据比较容易复制,对AI来讲真的是个小玩意儿,已经落后了。但是有些东西,大型的、格局更宽广的东西,这个恰恰对他们来讲恐怕要解决的问题更多。
李:所以,从这个角度上来讲,如你刚才说的,包括你说的你的学生,我突然感觉到作曲这个专业,以后的发展跨学科是一个方向(梁:对)。否则,你学那点小技术,学那么几年也没什么意思。跨学科以后可以把整个格局与视野扩展开来,把整个领域扩大,整个范围扩大。
梁:是的。这也是某种音乐和人的这种智力,用英语来讲叫intelligence吧(李:对),一种智力、智慧,这个词不是很好翻的,因为在英语的语境里面,intelligence包括很多意思,如智力、智慧、聪明、情报等等。所以从某种意义上来讲,我们在做音乐的时候要考虑到这是音乐在与AI的对抗与竞争。人的智力到底在哪些地方确实是AI所不及的。
李:有它独立存在的价值与优势。
梁:是。就是我们在音乐这个领域如何在更高程度上去发挥其优势。
李:其实我觉得这是一个课题,是大学音乐教育可以去攻克的方向,而且也是很迫切的。因为你别看现在AI还处在初级阶段,但它会发展得非常快。
一幅由AI生成的绘画作品《太空歌剧院》赢得科罗拉多州艺术作品比赛第一名
梁:所以,从某些程度来讲AI在发展,我们也在发展,我们人的智力其实并没有真正发挥出来,我们只是习惯了在某个环境里去学那些东西,实际上我们低估了我们的能力,我们不该只做这些事情。
李:你说得太对了。当我们在想象、在做事、在思考的时候,其实我们也在启动我们自己脑子里的运算能力(梁:是,是这样)。这种运算能力你要跟AI比你没它快,而且你积累的东西也没有它多,这就是大家都怕的事。但是,你刚才说的这个从艺术来讲有它的独特性,艺术创造和其他的自然科学相比之下从某种层面上来讲有它的独特性,它所依赖的生成方式与其他学科比是不太一样的。所以这个领域、这个方向真的可以把它作为一个课题来做、来研究探讨。很有意思的事,这个有可能会决定我们现存的音乐教育制度未来会发生什么样的变化。我们不说完全成熟的AI,只说如果AI再提高一步,你说现在的音乐教育这些东西还有多大用处?比如一个教配器的老师或者教和声的教授,辛辛苦苦几十年教学,写了一本书、一本教材,内容基本上是前人积累的成果加上自己的领悟而且有可能偶有发现,再用自己的语言叙述而成。这类著作的价值在AI时代我们不能说它完全没有了,只能说其价值明显会变得很低。因为这个社会已经从根本上发生了变化。这就意味着音乐学院的课程设置、内容乃至整个教学理念与运作方式要从根本上发生变化,否则你适应不了。
梁:我觉得很有意义,如果在课的安排里面,每个学校应该有这么一个让大家思想碰撞的讨论课,大家一起来想:我们现在做的哪些事情是AI做不了的?就比如说最简单的:音乐语言这么简单的题目。再比如说曲式,在我们所有已经探索的这些的基础上,为什么还要人来创造这个模型?哪些资源可以放进来?哪些想象可以放进来?它对包括AI的发展也会起到重要的作用。
李:音乐学院,我觉得不仅要关注自己的专业领域和自己圈子里面的事情,恐怕还得把目光放开一些,姿态可以再谦和一些,格局再大一些,世界上的或全社会的主流音乐早已玩儿到别处去了,玩儿嗨了,一首歌曲点击量可以达到几百个亿,都在同一个社会,同一口锅里,咱们总不能视而不见,无动于衷吧?眼界开了,胸襟宽了,信息量自然会大,主意也就会增多,对探讨起来时的广度与深度多少可能有些有帮助。当然这可能又是另一个话题,咱们可以放在以后再闲聊。
2023年9月9日,克罗地亚萨格勒布举办题为“萨格勒布艺术奇点:当人工智能遇见创造”的独特绘画展览,现场作品均由人工智能生成(视觉中国 供图)
尾
这篇散谈对话一定要放一个尾,撒点更散的料:
· 九月初一幅由AI生成的绘画作品在科罗拉多州艺术作品比赛中获得第一名。
· 一场全部由AI生成的画作展前不久在叙利亚开展,采访镜头里艺术家说很容易,输入几条指令立马结果就出来了。印象特别深的是人物画的胸毛浓如马鬃。
· 微软推出了Copilot。
· 马斯克推出了Grok。
· 谷歌继Bard后又推出了Gemini,据说在多项指标上超过ChatGPT4。
· ……其实还有其他AI新产品出来。
· 不久前马斯克接受英国首相苏纳克采访时形容AI像魔法精灵(Magic Genie),可以实现很多愿望,但最终没有好结果;AI将是历史上最危险的事物;AI机器人将很可能会对人类形成威胁(Robot Killer);未来将没有工作可干。
· 动画公司裁员已为必然选项,原因是AI。裁员的名单上应该会有更多的公司。
· 梁雷教授所说的什么是人有而AI没有的,后来想起来有可能的几个词:胸怀、信念、爱情等等,各位可往下补充。
2023年6月8日,瑞典斯德哥尔摩,世界上第一个人工智能雕塑“不可能的雕像”在科技博物馆展出(视觉中国 供图)
· 关于算法。有一位眼下AI届风云人物曾犀利指出,全世界所有AI公司之间的竞争本质上就是算法上的竞争。他认为不仅公司与公司之间的竞争是如此,国与国之间的竞争也是如此,甚至文明与文明之间的竞争亦是如此。提到如此高度,可见当今行家们对算法的重要性有多么看重。对此我是真正的外行,不懂也不敢对此胡乱说。
· 在提到“音乐人工智能大语言模型”时,梁雷教授提出了“这是谁的语言模型?”实话说这是一个非常严肃、关键而又敏感的问题。回答这个问题可以从这一点朝多个可能的方向延伸,而根据眼下的国内国际综合环境,这个讨论极有可能进入政治正确的境地,可能会上升到语言之争、文化之争、话语权之争,甚至更高层次的境地里去。一般的理解是:音乐人工智能大语言模型应该是客观地囊括了所有人类音乐文化财富的全部信息与参数,众生平等。尽管做到这一点不易,但任何小于这个范畴的音乐语言大模型则将极可能被梁雷教授上述的犀利提问而击中。不管怎样,各位,AI的发展速度看起来的确比想象得更快。精彩向你炫目而来。
· 李:突然想起早年到江西采风,一天因访一农村老妇而行在田间小径,田间植物、径边青草、远处农舍周围树竹混合而成的味道夹杂着一丝丝炊烟飘然入鼻,其中还有一丝手磨豆腐掺杂着刚被碾碎的豆子释放的味儿,突然脑子里引发起儿时残破而不定的许多画面回忆,一种莫名的伤感油然而起,时近时远,一种drone的音响在脑的后海时隐时现地飘荡。这种过程与感觉,未来AI会有吗?
点击订阅⬇️⬇️⬇️
《爱乐》2024年第5期
「AI与音乐创作的未来」
本 期 精 彩
主题|AI与音乐创作的未来
华彩|艺术家的穷途末路?
更 多 精 彩
前奏|自由的鸟鸣,抑或音乐的樊笼?
幕间|在娇美的五月
回旋|人生即赋格
行板|琉森:古典音乐狂热
专栏|袁乐—老摇滚的绝唱
鹭鸣—伍尔夫的音乐典故
安可|让老歌换新家
点击下方图片⬇️⬇️⬇️
获取《爱乐》数字刊全部精彩内容
点击订阅⬇️⬇️⬇️
《爱乐》2024全年纸刊
微信扫码关注该文公众号作者