高小榕:脑机接口50年
编者按
今年是脑机接口一个重要年份,脑机接口(brain computer interface,BCI)专有名词1973年创立,现在正好50年。
脑机接口是人机交互的特殊形态。传统的人机交互必须有肌肉组织参加,如键盘、鼠标、语言,否则就没法进行交流。脑机接口可直接从大脑提取信号控制外部设备,替代、恢复、补充或改善大脑的功能。
50年前,美国加州大学洛杉矶分校的计算机科学家雅克·维达尔设想,通过放置在头皮上的电极可检测到大脑发出的实时信号翻译后用于控制计算机,首次描述了脑机接口的科学概念与设想。此后,在各国科学家的努力下,脑机接口的概念范畴不断延伸,例如与反馈/调控相结合的脑机交互(interaction),与人工智能相结合的脑机智能(intelligence)。
脑机接口的科学意义有两大类,一是医学,当人的机体失能之后,如何与计算机交流?
另一个是怎么做“超人”,能跟ChatGPT之类的AI去交流。因为我们会面临一个问题,以后像ChatGPT这类的超级AI还带不带人“玩”了?怎么才能给AI机器人安上缰绳,让它一直带我们“玩”?
所以脑机接口是未来不可或缺的硬核科技,没有脑机接口的未来智能社会是不好想象的。
如果把脑机接口比作一幅拼图,前三块关键拼图依次是:脑信息采集、计算机科学及信号分析技术、神经科学。
1924年,脑电图之父、德国精神病学家汉斯·贝格尔首次记录到人类脑部的电信号活动,将其命名为脑电波。
汉斯·贝格尔是个富二代,很聪明,大学时攻读当时最牛的天体物理专业。当时德国的大学生需要军训,他在行军途中受伤,住院后接到家人的慰问电报,原来是他妹妹“感应”到哥哥受伤了。汉斯·贝格尔联想到他13岁时曾被电鳗电到的经历,他就琢磨,是不是自己和妹妹的脑子里,有跟电鳗一样的通讯工具?于是,他转专业去学了医,坚定地研究脑电问题。
1929年5月,决定脑电图重要性的首期出版物《人类脑电图的使用》问世,并发表于《精神病学档案》。如图,1929年最早报道的脑电图波形,可以看出有很强的周期性阿尔法波成分。
1929年,脑电图档案
正是基于这第一块拼图,1938年,美国神经学家赫伯特·贾斯珀在寄给汉斯·贝格尔的圣诞贺卡中,畅想了从脑电波中解码出语言的可能性,这被认为是对脑机接口的早期科幻描绘。
照片来自慕尼黑德意志博物馆
跨越百年,该想法于2021年实现了。2021年5月,美国斯坦福大学的研究人员通过植入电极采集大脑运动皮层的神经活动、使用递归神经网络算法解码出“手写”笔迹,将患者大脑中的意念快速转换为计算机屏幕上的文本。
再看第二块拼图。世界上第一台通用计算机“ENIAC”于1946年2月在美国宾夕法尼亚大学诞生。在随后的数十年中,计算机科学不断进步,并为数字信号处理与人工智能的发展提供了基础。
第三块拼图是神经科学技术。1969年,德国教授埃伯哈德·埃里希·费兹利用操作性条件反射原理,验证了灵长类动物运动皮质中单个神经元的活动能对控制模拟仪表指针产生条件反射,这是在脑机接口概念形成之前就实现了最早的脑机接口实践。
各学科互相影响与进步,历史的巨轮来到了1973年,雅克·维达尔提出了脑机接口的概念与设想,即BRAIN-COMPUTER INTERFACE(BCI)。我很佩服他,那时计算机才刚从一层楼变到一个冰箱那么大,连通用键盘和鼠标都还没有,他就在想,人脑怎么跟计算机通讯?
此后二十年,这个领域几乎没有任何进展,到了90年代,世界上有5个独立小组重新发明了脑机接口。1999年,首届国际脑机接口会议在十几个相近概念中确认“BCI”为特定专业词汇,并确认了其科学定义和评价标准。
人们大概会认为,如果没有脑机接口,霍金这样的人生存不了,我们这些人还能正常生存。但不是这样的,未来如果没有脑机接口,我们也生存不了——因为计算机不带我们“玩”了。
脑机接口的第一个价值是医学价值,人类面临的所有神经系统的疾病,都可以用脑机接口技术来解决,比如耳聋、肌萎缩侧索硬化症、癫痫、帕金森、脊髓损伤等。
脑机接口的医学价值
2018年,我们曾为渐冻症患者王甲设计一套中文输入的视觉脑机接口系统。后来,王甲在央视的挑战不可能节目中,成功地完成诗句朗诵的挑战任务,往脑机接口技术实用化迈进了一大步。
第一次在王甲家里给他装上脑机接口时,他打出的第一句话让非常感动我,他说:“我是身体上的弱者,但我是精神上的强者”。我们还曾在天坛医院给一个中风后无法说话的老先生装上脑机接口,他说的第一句话是感谢儿子。老先生已经不能说话了,但他只要有输出的机会,他就会去表达自己的内心。儿子几年来一直陪在他身边,看到这句话,眼泪哗就流出来了。
在医学的基础上,又拓展出非临床的应用,比如辅助通讯、状态检测、能力增强和身份认证。
脑机接口怎么通过智能增强(Intelligence Augmentation,IA)造超人?比如,它可以让人的某一项技能提高数倍,如果你平时一秒钟看一张图,戴上脑机接口后,一秒钟可以看十张图,如果用来做医学图像诊断,原来看一个病人的时间可以看十个病人。
马斯克最初切入脑机接口时,就是想做能够和AI交流的超人,这就属于能力增强范围。人与人沟通的信息传输率大概是100比特/秒,但机器和机器的信息传输率要大多了,光纤能达到10G,WiFi也达到100M,未来的多智能体社会就会产生交流鸿沟。马斯克就想,在大脑装一个第三皮层,直接解读我们的思维与AI交流。
身份认证也是脑机接口一个很重要的功能。在未来网络社会,特别是有了元宇宙后,人们不能面对面交流时,怎么确认谁是谁?现在所有的身份认证都基于物理特征,这都是容易伪造的,但基于大脑的脑纹认证理论上是不可伪造的。
再如,咱们都知道图灵测试,图灵提出了一种测试机器是不是具备人类智能的方法:如果一台电脑表现(act)、反应(react)和互相作用(interact)都和有智能的个体一样,人无法区分,那么它就应该被认为是具有智能的机器。ChatGPT出来后,这个问题可以认为已经解决了,而且机器产生的东西比人快得多。
紧接着就会碰到一个问题,我把它叫逆图灵测试:人和机器分别发出一个信息,然后机器要去判断,信息是人给的还是机器给的。如果你发出指令后,机器无法区分指令由你还是由机器发出,这就乱套了。例如,如果你养了宠物,它不认识你,你还会养吗?所以,逆图灵测试就是一定要让机器知道主人是谁,如果机器没有主人,就一定要强制地“关掉”它。所以,脑机接口是未来的核心科技,没有它就无法实现逆图灵测试。
脑机接口的里程碑
我们再回顾一下脑机接口的发展进程。从发现脑电波到1973年前,基本上是科幻阶段;1998-2016年,是科学论证阶段;2016年至今,是技术爆发期。
1973年之后,脑机接口经过了15年科学论证、15年学术研究、20年技术发展。
1988年,Farwell和Donchin首次使用脑电ERP中的P300成分,通过行列闪烁编码范式设计了第一套P300 speller系统,产生了P300-BCI范式。
1991年,Jonathan R. Wolpaw训练用户自我调节mu节律的幅值,通过mu节律幅值的变化实现光标的一维控制;1993年,Gert Pfurtscheller等构建了基于感觉运动节律的事件相关去同步(event-related desynchronization,ERD)的脑机接口系统,从ERD的时空模式区分想象左/右手运动。
1992年,Erich E. Sutter开发了一种基于伪随机序列调制的视觉诱发电位(SSVEP)的脑响应接口,该系统利用视觉诱发电位可在一个8×8视觉键盘上识别用户注视的方向;1995年,Grant R. McMillan等人通过生物反馈使受试者学会增加或减少SSVEP的幅度,并将其用于控制一个简单飞行模拟器侧倾运动。
1999年,Birbaumer 等利用慢皮层电位(slow cortical potentials,SCPs)幅度变化控制光标一维运动,实现了名为思维翻译器(thought translation device,TTD)的文字拼写脑机接口。这是第一次在病人身上做脑机接口实验,病人打出了一条完整的信息。
1999年,清华大学团队开发了四目标SSVEP脑机接口,并将其用于控制光标移动。
为什么我们能在1999年发表脑机接口文章?我们曾在1995年接过一个项目:航天员上天之前,都需要进行太空环境适应训练,训练最多的是离心机。因为离心机高强度的重力加速度刺激环境,在训练中人常常会来不及喊停便陷入眩晕。我们就负责在离心机实验环境中,检测受训人的大脑意识状态,通过脑机接口系统分辨受训人是否清醒,从而控制离心机,这也是中国第一个脑机接口实验。
目前,全球已有50个人的大脑中植入了电极,能够完成喝水、打字、写字等操作。
第一个把脑机接口往人脑放置电极的人,是PK,他是脑机接口的功臣,大家要感谢他。他曾把电极植入自己大脑的语言区,希望能用计算机说话,但植入几个月后,他不会说话了,赶紧让同事帮他取出电极,但已经拿不出来了,长在脑袋里了。现在他已痴呆了,电极还在他的脑子里,而且至今仍能看到神经发放。出事故后,他没声张,否则脑机接口要倒退很多年——后来的很多工作都不能做了,因为第一个就出事了。直到后来其他人做成了以后,他才把这个“失误”对外公布。
2014年,巴西世界杯开幕战上,截瘫青年诺·平托身披“机械战甲”开出第一脚球,向世界展示了脑机接口的价值。
2015年,华南理工大学李远清团队通过人脑与电脑的沟通,发现大概10%的植物人是有一定程度的思维活动。
2016年,在天宫二号和神舟十一号载人飞行中,天津大学明东团队与中国航天员中心合作完成人类首次太空脑—机交互实验,实现了静默的交流。
2018年,清华大学脑机接口团队为渐冻症患者王甲设计了一套中文输入的视觉脑机接口系统。
2018年,FaceBook实现了用意念打字。
2020年,浙江大学完成国内第一例植入式脑机接口临床研究。
2019年,加州大学旧金山分校团队将受试者说话时同步记录的ECoG信号解码为发声器官的不同活动形式,根据发声器官状况和发出声音之间的关系再实现了语音的合成,即便是在受试者“默读”的情况下也能够实现语音的合成。
2023年,瑞士洛桑联邦理工学院团队发表了一种脑—脊髓接口(BSI),由一个植入的记录和刺激系统组成,能让大脑和参与行走的脊髓区域连接起来。
2019年7月,马斯克的Neuralink发布了一款可扩展的高带宽脑机接口系统。2023年5月,FDA批准Neuralink开展人体实验,现在就看马斯克能不能把人体实验做成。马斯克确实非常超前,他的想法是,如果人在地球上不能生存了,我们去哪?去火星;地球都被机器人占领时,我们怎么办?连上脑机接口,跟机器人去沟通。
实际上,要把电极植入大脑非常困难,面临三座大山。
第一座叫物理的山,硅是世界上最硬的材料,脑是人体里最软的组织(除去血液),如同我们需要找到一个能够把一根针立在豆腐上的方法。后来有人就想到把电极装到血管里,血管的弹性和硬度比脑要好很多,内科医生就能完成介入手术。天津大学段峰教授就是做的这样的技术,这确实是一个突破。
第二座山叫做生物兼容性。我们把一个物体植入人体组织里,人的免疫系统会发生排斥,从而引起感染的风险。
第三座山是信息的山,将接口植入脑内以后,收到的信息量是非常巨大的,如何将海量的信息解读出来同样是一大难题。
我们看看全球脑机接口文章发表的数据。1973-1999年,发表文章36篇;2000-2009年,发表文章1115篇;2010-2019年,发票文章7711篇;近三年(2020-2022年),发表文章5031篇,每年1500篇。
从学术文章数量来说,中国已经是脑机接口研究大国,2019年,中国的文章发表数目就超过了美国,成为脑机接口论文第一的国家。但我们还不能叫强国,以文章的引用数来看,美国的引用数近12万,中国不到3万,差距还较大。
为推动脑机接口的跨越融合发展,2005年开始,清华大学团队牵头组织国内历届脑机接口比赛。比赛中有一个对抗环节,用脑机接口跟手机比输入速度,目前,脑机接口的速度已经达到触屏的一半。2019年的一次挑战赛上,一个人打字的速度甚至能比手机触屏还快。
脑机接口有一个现象,女生比男生强,男生跟机器交流的速度不如女性。十多年来,我们一直不清楚原因,为什么每次比赛前几名总是女生?去年我们终于弄清楚了,男生颅骨太厚,信号被衰减了。
脑机接口的技术发展
无创脑机接口的电极,在由湿电极向干电极方向发展,体积上向小型化发展。
30年前做脑电,需要把针插进去,避免头动,现在我们清华大学研究出柔性入耳电极,放置入耳加热后会贴合到耳内壁上,跟计算机通讯时,别人是看不见的。放进去后,除了打字,还可以知道你现在听没听课。
这样的功能可能侵犯隐私,这是脑机接口一个重要的伦理问题。现有的法律以行为结果来界定是否犯法,例如,杀人犯法,但想杀人并不犯法,如果能知道人在想什么,就可能涉及歧视。
还有一个重要的伦理问题:以往的所有设备,不用了可以随时取下,但植入式脑机接口不能拿出来,睡觉时,做的梦也会显示出来,自己看看还好,但旁人也能看到就尴尬了。从这个角度来说,我比较推崇以非植入式脑机接口为主,可以随时取下来。脑机接口设备的发展已经进入可穿戴、无线、便携式,再过50年,脑机接口会可能是非接触式。
脑机接口一直在往前发展,已经有了情绪脑机接口、混合脑机接口、认知脑机接口。你聪不聪明,不需要答卷,直接就可以测出来了。
大数据时代,我们的实验室是世界上公布脑机接口数据最多的实验室,而且数据量比别人大一个数量级,能做到这一点,很重要的原因是我们每年的脑机接口比赛,参赛数千人的数据都被记录下来了。
脑机接口的传输率是它的评价指标,这个指标一直在上升,我把这叫做“脑机摩尔定律”,上涨的速度大概是每十年翻四倍。人的语言速度是不可能翻倍的,但脑机接口传输率的速度会变化得很快。
脑机接口市场分析
实际上,目前脑机接口还没有真正的市场,但可以有估值。全球医疗市场有2万亿美元,神经药物类市场规模达上千亿美元,脑机接口技术实现后,市场规模会将是前者的1/10~1/3。根据麦肯锡测算,全球脑机接口医疗应用的潜在市场规模在2030-2040年有望达到400亿美元,其中严肃医疗应用潜在规模在150亿美元,消费医疗应用潜在规模在250亿美元,年复合增长率会在10%以上。我认为这个估算是比较靠谱的。
海外脑机接口公司估值最高的是马斯克的Neuralink,50亿美元,第二高的是做非侵入式的MindMaze,15亿美元。
在中国,脑机接口企业分为三类。一类专门做脑机接口的,以博瑞康为代表;一类是从做生物科学和材料科学转做脑机接口的,以脑虎科技为代表;还有一类是做其他医疗领域的,发现它的技术跟脑机接口很相近,就转头做脑机的,以应和脑科学为代表。在这些企业中,达到C轮的是博瑞康,它已经递交了IPO材料,即将成为中国脑机接口领域第一个上市公司。做植入式脑机接口的企业里,技术最靠前的是微灵科技。
马斯克的Neuralink的50亿美元估值出来后,中国的所有脑机接口公司的市场都被认为被低估了,可能需要重新评估,我认为保守估计可以翻一倍。而且马斯克的人体试验一旦做成,可能50亿美元估值就一下子变成100亿美元,所以今年会是脑机接口企业估值增长的年份。
国内脑机接口行业部分投融资情况
中国应该出现一家纯脑机接口的公司上市,现在的公司都只是做一些和脑机接口相关的技术。
脑机接口产业链包括上游的脑机接口芯片和脑电采集设备厂商、操作系统和软件提供商、数据分析服务商,中游的脑机接口产品提供商,以及下游包括医疗、教育、游戏、智能家居、军事等应用领域。在美国,脑机接口前十年80%的投资来自军方,从军事应用再溢出到其他领域。而中国是民用影响了军用。
从应用范围来看,侵入式脑机接口主要用于临床级应用,具体的临床适应症更偏向于一些难治性脑部疾病比如癫痫、肢体运动障碍等。非侵入式脑机接口同时在消费和临床两大场景有应用,典型的消费级应用包括睡眠监测、抑郁情绪早期监测恢复、压力情绪监测等。临床级应用包括意识监测、意识障碍改善、认知障碍改善、精神疾病失能改善、儿童多动症改善、听觉、视觉、触觉等感觉缺陷的替代。
此外,还有一大类应用场景可能在教育领域。比如怎么让学生减少疲劳感,怎么提高学习效率、更快接收信息等,脑机接口都能找到用武之地。
据硅谷Live的相关研究显示,脑机接口产业在医疗健康产业方面,主要应用包括脑机接口设备、大脑检测系统、多动症脑机接口反馈治疗等;在教育产业方面,可应用于学生记忆力训练以及学科培训等场景;在游戏产业方面,可通过虚拟结合方式实现思维控制设备及游戏角色;在智能家居产业方面,可与物联网等技术结合实现用意念控制家用电器等。
非侵入式脑机接口,中国掌握了全产业链的技术,包括芯片,电极等。美国讨论了几次,想要对中国脑机接口进行管制、禁用,但发现在无创领域卡不住咱们,我们该有的都有了,甚至有的领先,而在有创领域,中国还非常弱,跟美国有五六年的代差,它也就没有必要管制。
脑机接口的未来
经过50年的发展,脑机接口已在医疗、工业、教育、娱乐领域初步落地应用,且得到了科研及产业领域广泛的关注。
脑机接口距离大众想象中的效果,还有很长的距离。当下面临五个主要挑战:
一是采集技术的限制,当下的采集技术,无创采集信号强度弱,有创采集安全风险高,因而限制了神经机制的研究,抑制了脑机接口的发展。
二是人脑有很大的个体差异,进而高级皮层的信息解码难,且模型往往需要个性化定制。
三是造价与维护成本高,而当下的脑机接口需求量小,因而无法通过规模效应降低成本,限制了产业的发展。
四是脑机接口的数据互通性差,一方面大家不愿意共享,另一方面数据在范式、格式、采集设备方面存在诸多差异,难于形成大样本的数据集。因此限制了深度学习、强化学习等技术在脑机接口领域的应用。
五是脑机接口的伦理安全问题,植入式脑机接口与交互调控技术存在较大的伦理安全风险,同时脑数据隐私保护也是伦理安全的重点问题。一个玩笑的比喻,假如Neuralink给一帮人植入了电极,然后马斯克一高兴,坐火箭去了火星,那地球上这些装了脑机接口的人,是跟着去火星,还是让脑机接口废掉?因为没人服务了。
“AI教父” Hinton说,数字智能优于生物智能的进程无法避免,超级智能很快就会到来。“中国BCI先驱”高上凯认为,脑口智能让我们更好地与人工智能相处,构建以人为核心的超级智能。未来,超级智能肯定会到来,脑机接口则是人类必备的缰绳。如果没有这个缰绳,人类无法控制住机器人,因为机器人比人类强。当然,机器人什么时候懂得把缰绳解掉,那是另一个问题。如果未来的超级智能时代,人是可有可无的,这时就必须给超级智能按下暂停键。
基于上述判断,脑机接口一定是未来的核心技术。
在过去半个世纪,脑机接口实现了从科幻到产业落地的突破,从0到1,再从1生2;希望各位同仁协同攻关,克服挑战,在未来的50年,推动实现脑机接口2生3,3生万物。
问:电极植入脑子里后,收集到的信号如何解码,信号翻译的原理是什么?
高小榕:在大脑里记入的信号都是神经发放,我们只能先去猜猴子或人想做什么,计算机再去学习。用类似巴普洛夫的实验来解释,每次给猴子喂食的时候摇铃铛,猴子知道有铃声时会有食物,在有铃声时记录下信号,后来发现,没有铃声时,也有这样的信号,这就是学习的过程。计算机学到这些信号与行为的对应关系后,会有互动交流的过程,把信号翻译出来。
脑机接口做猴实验时,一开始机械臂是随机乱摆的,猴子不知道机械臂可以帮它递食物,突然有一次,它发现自己有了某种想法后,机械臂就过来了,以后,它一想吃食物就会在脑子里重复那个想法。
问:你曾提到,大多数人用现有科学去研究未来技术,马斯克是用未来科学去研究未来技术,那我们怎么去获取未来科学?
高小榕:想象下,横轴是技术,纵轴是科学,人在基座上,这是现有技术和现有科学。一个技术发明者,用现有科学沿着横轴走,就发明了未来技术,同理,可用现有技术发现未来科学。
还有另一个线,是在45°角上,那里是未来科学和未来技术,如果用“不靠谱的科学”去研究技术,就容易被认为是伪科学,这需要设想,未来会出现什么样的技术?未来技术去研究未来科学,那你就比别人超前,前提是判断一定要对。马斯克就是如此,他几乎每次都能判断对。
科学研究一定要有宽容精神。做研究时,会被问到可行性,但有的技术科学论证都还没完成。马斯克自己有钱,就自己去做了。
问:过去有很多讨论,认为中国出不了创新型人才,有很多关于教育的批驳。就你的体会来讲,在我们现在的环境下,能不能出一些世界一流的人才?
高小榕:这个问题我不可能给出答案。
如果一个中学生,学不好语文,整天在想,电梯如果到光速会怎么样?这样的人,他的班主任能不能容忍?爱因斯坦就是这样一个人。
再比如控制论的创始人维纳,把他放在中国的环境下肯定会受影响。有一天他要搬家了,他对这种事情不上心,太太给他留了新家的地址的条子,在回家路上他突然想到一个问题,就把纸条拿出来,坐在路边推演公式,认为推错了,就把纸条扔了,这下他找不着家了。他回到原住处瞎溜达,看见一个女孩就问,你知道维纳夫妇搬哪去了吗?女孩回答:“爸爸,妈妈让我来接你。”这样的人,在中国能大学毕业吗?他高考可能都过不去。
咱们的教育要有科学的宽容精神。
问:在脑机接口领域,如果实行揭榜挂帅,搞一个大的规划,是否可行?
高小榕:科学就像打靶,没打着有三种可能,一是脱靶,瞄准了,手抖没打着;二是错靶,你瞄这儿,完了发现ChatGPT在那儿;三是空靶,你认为那根本是不可能的事儿,咱就喝茶就得了。
我们做脑机接口时就遇到“空靶”问题。我们经常被打假,被质疑是不是科学的,我们就会说,那你过来试,我保证你心想事成。有著名学术打假者也曾派人来我们这儿,一开始他态度不友好,试完了没话说了。
关于揭榜挂帅,我可以举个例子。脑机接口里有一个关键芯片,叫ADS1299,我们认为这个芯片国内必须掌握。立项时,条件就是必须双盲揭榜,专家也不知道哪个芯片是谁的,测试完性能后揭开看。我们还有一个要求,要做这件事,必须“卖身”,即使这次做不出来,也必须做下去,直到做出来为止。这个要求吓退了一批人,但敢接这个单子的人绝对有两把刷子,最后剩下的两个团队都做出来了。
中国科学原来有一个思路,叫“有所为,有所不为”,这是值得商榷的,“不为”是不会做且不做,但我们应该是“无为”,即会做而不做。中美对抗时,必须做到无为,我们可以买美国的芯片,但绝对不能不会做。
问:国内脑机接口还在医疗领域做了哪些实验?为什么无创脑机接口,中国能做到跟国外技术持平甚至领先?
高小榕:所有疾病领域,无创脑机接口都有涉及,不同的团队在尝试。
无创脑机接口的研究,一个教授、一个团队或一个学科,就能开展。但有创脑机接口的研究组一定很大,必须有医生团队、电子团队、信息团队,至少在10人左右,其中只有一人能发文章,团队要怎么养?这是科研体制的问题。我的团队做了这么长时间,都是临时工,人通常可以流动,大团队必须国家有持续支持,才能稳定团队。
问:你提到“脑机摩尔定律”,脑机接口的传输率大概每十年翻四倍,这个增长会是无限的吗?
高小榕:“脑机摩尔定律”是大家的期望,至少过去二十年是按这个速度增长的。现在脑机接口的速度是触屏的一半,十年后应该能做到比打字快,大概二三十年后速度就会比语音快了,那我们就可以不用屏幕,戴一个耳机,想输出时思考就可以了。未来能到多快我不清楚,我希望一直往上涨。
问:你认为教育和科研工作者与真理的关系是怎样的?脑机接口的人才缺口问题如何解决?
高小榕:中国对教师的定义有缺陷。《师说》中的定义是“传道授业解惑”,但这件事父母也能做。另外是把教师比作园丁,园丁的重要职责是拔野草,他不会浇灌所有的花草。还有一个比喻是灵魂工程师,但灵魂是什么?造灵魂,那胳膊腿还要不要造?而且工程师拿到所有的东西,都要去“加工”。
我对教师的定义是:传授真理,成就他人,服务社会。
教师应该是真理的爱好者,因为爱好而去研究、鉴别、传授真理,发现真理是教师的副业而非职责。父母是用基因、财富成就孩子,教师则用真理去成就他人。
教师是“服务的平方”,不直接服务社会,而通过成就他人,让他人去服务,如果教师直接服务社会,那就是“教会徒弟,饿死师傅”。在我的实验室,学生毕业后可以带走所有的东西,把所学直接拿去用。企业雇用我的学生,为什么好用?我们的代码始终共享。当然,很多投资人会找到我,让我做产业转化,我并不特别关注这个,这跟我间接服务社会的理念有差距,我的很多学生都有去做转化,也有的做得很好。
如同数有实数和虚数一样,知识也有“实部”,有“虚部”,前者是真理,能实化,后者是猜测,可能对,也可能不对,我会把这个也告诉学生。有“虚部”的学生,他有追求,认为“虚部”可能转成“实部”,能带来的东西是不一样的,我的学生都有这样的理念。
问:脑机接口技术能走多远,是否取决于脑科学的发展?
高小榕:并非脑科学发展到一定程度才能做脑机接口,脑机接口做好了,也能反过来促进脑科学,它们是相辅相成的。
在构建以人为核心的智能体时,不能伤害脑子,这涉及伦理问题。我会警告所有往脑子里写东西的技术,写入的前提是要有橡皮擦,万一写错了还能补救。现在大家不知道橡皮在哪,那就先别写,可能永远没有橡皮,那就永远别写,可以构造一个AI去写。如果有橡皮,还要保证橡皮一定在自己手里。《三体》中描绘过“思想钢印”,这个词挺精准的,因为一旦写入就擦不掉了。
这样的“写入”技术在生物学上是完全可行的。德国曾做过实验,在人睡着时检测脑电波,在某个特定脑电波出现时,就告诉你一件大脑原本不知道的事。比方说,往受试德国人脑子里写入“孙悟空特牛”,白天让受试者答题,在“孙悟空特牛”和“孙悟空特low”之间,80%的人会选前者。理论上,可以在人做梦时,给人写入各种知识,他白天自然就会做题了。这样的技术曾被传教者用过。但是,这样的技术有风险,比如说,往人脑写入“拉登特牛”怎么办?
问:人类的碳基文明是否最终可能变成硅基文明?
高小榕:人从猴进化成人,也可能再进化成AI,被搁在进化树的一杈上,这在理论上是可能的,但我认为绝对不能让这成为现实。
我们现在讲“AI对齐”,让AI和人的价值观与利益保持一致,但这是不可能的。人性本“畏”,畏惧是写在基因里的,所有的活动都是为了解决“畏”的问题。“畏”的后面就是“死”,如果一个人不怕死,你就拿他一点招都没有了。机器没有“畏”,它是不死的,或者可以死无数次。所以,我们必须给机器安上开关,它做的事必须由人发起和负责,否则就会失控。
我们要构建以人为中心的超级智能时代,就要用做一个脑机接口的缰绳,如果机器的行为不能引起脑机接口的响应,就要关掉它。现在有人认为应该暂停AI,我倒觉得不一定暂停,只要握好缰绳就可以。
问:最近苹果公司推出了混合现实(MR)眼镜,你认为未来大的技术,是否已经有了一条比较明显的主路线?
高小榕:主路线是存在的。过去,所有的好东西、好技术都往客厅放,后来是往PC机放,往手机放。
再之后要往哪放?一是汽车,咱们国家就押宝在这。但我认为这不是最好的方向,有多少长期待在车上的人需要车里特别豪华的?好东西放里面,只能作秀。
另一个是眼镜,我认为这是未来50年的趋势,因为眼镜可以一直戴着。屏幕分辨率已经到了一种需求上的“天花板”,也就是说,即使分辨率再提升,但人的肉眼已经分辨不出差别了。接收信息进入了一个新的视觉化阶段,苹果推出的混合现实(MR)眼镜,就是其中代表。从以电影、电视为代表的多人一屏,到以电脑、手机为代表的一人一屏,接下来的方向可能就是把屏幕做小,比如整合到眼镜上、成为元宇宙的入口之类,这些设备彼此之间还要相互连接,进入多人多屏阶段。
多人多屏,或者近眼显示技术,它的成像是虚像,和我们习惯的鼠标、键盘等外接设备很难匹配,但是脑机接口可以完美适配。元宇宙需要以智能眼镜为代表的硬件支持,而只有具备了脑机接口的属性,才能够交互得好。
过去,所有的高科技企业都往车里装东西,把钱全砸在车上,苹果的眼镜出来后,才发现都错了,车里不需要那么多好东西,安全最重要。在车和眼镜之间,我投眼镜一票,未来笔记本和手机都没有之后,所有人都要戴眼镜。
我认为元宇宙必须实现“四联”才能够让人感觉到它的优越性:
第一是互联,即信息必须能够互通。
第二是价联,就是价值连接,在我这里显示好的东西在另外一个人那边也应该显示是好的,才可能实现价值供需平衡,价联的基础技术就是区块链技术。
第三是境联。视觉的境界、听觉的境界、触觉的境界、嗅觉的境界,将人的这些感官连接起来。
第四个技术就是脑机接口,我把它叫做灵联,也就是我们的灵魂、思想,能够通过这个技术很快地传递。比如说我高兴了,在你那显示出来的我的数字替身也应该表现出高兴,这种情绪和灵魂的连接能够让对方感觉到。
微信扫码关注该文公众号作者