如何成为 AI 第三波弄潮儿,不妨读一读历史
时至年底,如果要总结2023年的科技产业大事件,人工智能几乎可算贯穿全年的主线之一。
从去年年底GPT-3通用语言大模型出现“智慧涌现”,到今年年初ChatGPT高调出圈;从如火如荼的“千模大战”,到“所有业务都值得用人工智能再做一遍”;从英伟达市值一飞冲天,再到OpenAI的人事变动大戏……
不过,在过去数十年的大部分时间里,这条AI赛道上没有IPO的锣声和花团锦簇,有的只是漫长的荆棘之路。
对中国AI人来说,更是如此。由于错过了上世纪50年代的世界人工智能的第一波高潮,中国人工智能界没有明斯基、麦卡锡、司马贺、费根鲍姆、辛顿这样的权威学者,但从上世纪70年代起,我们迎头追赶,以相对有限的资源投入,不仅在符号主义人工智能的研究上取得了世界级的成果,也赶上了神经网络研究的热潮,逐步追到今天世界第二的位置。
这个过程中,一件大事是国家“863”计划,在上世纪90年代全球人工智能跌入低谷的转折时刻,“863-306”主题通过持续投入,在高性能计算机、智能接口、智能应用等方面去的一批重大科研成果,为我国培养了一大批进入国际高技术前沿的计算机人才,也成为曙光、汉王、中科星图、科大讯飞、寒武纪等一大批高技术公司的源头。
近期出版的《中国人工智能简史(第1卷)》从1979年写到1993年,通过大量对当事人的采访,以中国计算机学会的人工智能和模式识别委员会,以及中国人工智能学会的部分人员为主线,系统梳理了中国人工智能发展早期的源流,为今天希望了解和投身人工智能领域的朋友们提供了一张不可多得的地图。
“人工智能的发展是一个螺旋式前进的过程。以史为鉴,可以帮助我们懂得在科研工作中把握规律,不随波逐流,更好地迎接这些挑战。”鹏城实验室主任、中国工程院院士高文在本书序言中写道。
本文是科工力量对《中国人工智能简史(第1卷)》作者之一、雷峰网创始人林军的采访实录。
科工力量:从您的角度谈谈这本书的写作背景和目的?
林军:高文老师在序言里也提到了,那是2018年的元旦,我在美国圣地亚哥白沙滩陪女儿度假,突然接到老师的视频电话。他说,有个关于《中国人工智能史》的PPT,想问问我的意见。
我听着听着,发现画风不对,原来他是想忽悠我来写。我头脑一发热,就答应了。
几周之后,我回到国内,跟高文老师在办公室面谈。高老师给了一个思路,以中国计算机学会的人工智能和模式识别委员会,以及中国人工智能学会的部分人员为主线,展开我们的访谈。
中国计算机学会(CCF)是一级学会,其人工智能和模式识别专委会是相当于其他学会的二级学会,具有较大的影响力。而中国人工智能学会(AAI)起初并不是一个纯粹的搞人工智能的学会,其中还包含了很多社科和哲学等领域的学者,这一定程度上导致他们与计算机科学为主的学会之间某种程度的不契合。随着时间的推移,中国人工智能学会也逐渐转向更专注于自然科学和工程领域的方向。
以这两大学会的人员和发展为线索,在一定程度上能够反映中国人工智能领域的发展历程,当然,也不完全涵盖所有对人工智能领域有重要贡献的学者和机构。
然后我就去了一趟东北,拜访了中国自然语言领域的重要老师、哈工大的老系主任王开铸,还到吉林大学找了王湘浩的学生刘大有等人。回来后开始构思和准备写作。
但是这本书的出版经历的时间比较长,也有点曲折,首先因为我当时正在集中精力写《沸腾新10年》,到了2020年,又出现疫情影响,再叠加当时人工智能话题在舆论圈不是热点了,出版社也不太热心,就把出版进度给耽搁了。但是访谈一直在推进。
到了2022年底,ChatGPT又火了,我们就加快进度,在2023年先出版第一卷。目前,第二卷写了一半多,第三卷写了30%,我们想争取春节前把第二卷写完,到明年7月能把第三卷写完。
科工力量:去年年底以来,通用大模型的进展会不会影响到你们第三卷的写作?
林军:我们这三本书的逻辑设计是,第一卷写学术起源,厘清中国人工智能的源头在哪,开山立派的宗师是谁;第二卷是开枝散叶,更多写教育家的故事,这一阶段正值全球人工智能低谷,各位宗师们开始传弟子,这些学生现在大都是各大高校的系主任、各大科研院所的所长、各个体系的带头人;第三卷我们认为应该写继往开来,谈一些人工智能产业化的进展,因为2008年之后互联网崛起,开始有算法推荐引擎、有机器视觉、有自动驾驶等产业应用。
2021年我们的写作一度停顿,原因之一就是发现这一系列写作有点难以收尾。
当时,虽然语音、语义、机器,安防、自动驾驶等各种各样的应用场景都已经衍生出来,但它只是大家对 AI的产业化过程中比较前沿的一些应用的投入,在资本市场上也有一定的高估和泡沫。
本来我们不知道该怎么结尾,总不能写一部产业史,最后写到行业一地鸡毛,到2022年下半年GPT出现了,我们就可以把结尾落到GPT大模型带来的新的产业化。同时,这两年人工智能发展很快,我们会再写一个面向未来的篇章。
科工力量:您在写作时预想了哪些类型的读者?
林军:我们还是首先希望吸引人工智能的研究者和从业者。
首先最核心的读者应该是做研究的人,特别是一些新进入行的年轻朋友,应该搞清楚学术和学科的脉络。其次我们想吸引人工智能的从业者,帮助他们了解学术的发展情况,我们的目标基本上是这两类读者。
科工力量:高文院士在序言写道,人工智能在世界和中国几十年发展,是一个螺旋前进的过程,现在人工智能火了,很多研究者和从业者不知道历史,就有很多似是而非,您怎么看待这个问题?
林军:过去几十年,人工智能并不是一门显学。
我就是学人工智能的,专业是图像处理和模式识别,现在叫作计算机视觉,实际上我们当年毕业的时候很难找到工作,一个方向是去公安局,因为有罪犯的抓捕用到拍照和识别;另一个方向是去航天系统,做数据传输和遥感这些方向,合适的工作机会很少。
所以在我们看来,人工智能长期处于行业低谷。我们是完整经历过低谷和高潮的,所以在低谷的时候,我们没有那么悲观,在高潮的时候,我们也没那么乐观。
现在对人工智能的炒作和鼓吹,有些来自科幻爱好者,他们更多是依靠想象力,但我们是计算机出身,更多还是要讲这些事情有没有可行性,从理论和逻辑上推演,能不能成功。当下有些舆论热点跟计算机本身是有没关系的,但大模型是算力提升带来的结果,这是有可行性的,虽然解释性还有点问题。
科幻作品《三体》
我们认为,当下算力提升带来的人工智能高潮,是又一波螺旋上升,会带来一批新的应用推向市场,吸引市场上新的投资投入研发,开发新的算力。当然这个过程中又会有一些泡沫,算力的持续迭代本身也是一个周而复始的过程,呈现波浪前进的特点。
现在有很多年轻人是在泡沫过程中加入进来的,这可能产生一些问题。我们认为,对于新技术带来的可能性,永远是既不要高估,也不要低估。
科工力量:书中第八章和第十五章集中讲述了“863-306计划”的故事,高文院士当时主导智能接口研究,李国杰院士主导“曙光”系列计算机,在全球人工智能低谷期,中国人工智能的研究和产业化为什么能加速追赶?
林军:要承认,在863-306项目早期,我们确实一度想向日本“抄作业”。
上世纪90年代中期,日本大力推动第五代计算机,不但在人工智能方面加速追赶,同时在存储芯片上强势发力。英特尔也因此放弃了存储芯片的生产,将这项业务外包台积电代工,才有了自身芯片业务的涅盘重生。
日本风光一时,在中国就有了参考美国还是日本的不同路线之争。当时国内有不少人倾向于日本路线,高文和李国杰两位院士作为当时的年轻人,对确定路线发挥了作用。
这是这本书第八章的内容,当时,高文正在日本留学,学习的就是人工智能,他给出的意见是认为日本的人工智能路线有问题。李国杰当时在美国普渡大学读书,与王凯、黄英杰等人很熟,提供了很多美国方面的情况,也提出了自己的见解。
他们两位都采用了实事求是的方法,导致中国在人工智能重要方向的抉择上,选择了高性能计算路线,也就是美国路线,而不是日本五代机路线,更加符合中国国情,对中国产业界和应用层面也带来更多的帮助,包括后来863-306项目对科大讯飞的支持,这是后话。
在计算机和人工智能方面,有很多人埋头做自己的事,但事实证明,在有限的资源限制下,哲学思维和战略方向很重要。
科工力量:在本书2018年策划之前,2016年的AlphaGo也掀起一波人工智能热潮,您认为当时的情况跟现在对比,有哪些相同点,有哪些不同点?您也是媒体从业者,怎样看待当下在人工智能方面的舆论和投资环境?
林军:2016年,雷峰网与中国计算机学会合作创立“全球人工智能与机器人大会”(GAIR),这可能是我个人对逢“6”的年份有些玄学的着迷,你看,2006年初是“iPhone时刻”;1996年微软发布了Windows95;1986年是第一台386计算机发布,是PC的重要时刻……
所以我们认为2016年AlphaGo事件是人工智能在公众领域破圈,也很可能标志着人工智能的一个重要时刻,并且拥有了小范围的拥趸和投资先行者,并裹挟一些投机人员进入这个领域。
到了2022年,ChatGPT出现,这时行业已经发展了六年多,第一批投机者已经被挤出去了,又有新的投研机构会加入进来,目前看来,人工智能像PC和移动互联网一样成为一个产业的可能性已经比较大了。
一旦成为产业,它再往下走向新的低谷的可能性很小,我个人认为,人工智能产业在2026年左右会到达一个高点,然后进入横盘。
科工力量:当下有一些国内的大企业和国家队在对标GPT,但也有一些舆论认为国内水平还差得远,您认为如何客观评价?
林军:到年底国内能够达到GPT-3.5的水平,到明年年中大概能追到GPT-4的水平,这是目前大家比较客观、统一的认知。
科工力量:这样追赶的话,差距是在缩小还是扩大?
林军:在缩小。
我们有一个很有意思的观察,我们曾经在硅谷见了当时在Facebook中最年轻的华人e9级人才王美宏,他后来在快手担任过海外技术总负责人。
王美宏是全球最早做推荐引擎的人,他对我们分享了自己的观察。
2012年,他就在Facebook做推荐引擎,2014年他有一次回国,当时国内大家都只是听说过这些引擎,没有人在做;2016年他再次回国的时候,发现国内做的推荐引擎已经有模有样了;到了2018年,他发现国内的推荐引擎已经做得比国外好了。
从这个小例子可以看出,只要有驱动力,在应用创新方面,中国人是领先的,只是在底层技术能力的创新方面,的确还没有美国人强。
美国人能做出安卓,中国人能做出微信,大概是这样的逻辑。
科工力量:国外人工智能拥有先发优势和生态优势。之前AlphaGo出圈,当下ChatGPT出圈,加上英伟达的GPU芯片、cuda工具链、TensorFlow和PyTorch的主流ai框架,大量的开发者,强势的英语语料,还有成熟的资本和融资环境,共同构成了一个具有先发优势的强势ai生态。面对这样的情况,中国的企业应该怎么应对?
林军:这要看我们怎么定义“中国企业”。如果所谓“中国企业”是在中国创立,只用中国原创技术,做中国本土业务的企业,那这样的讨论可能没什么必要。但是如果谈论的是中国人主导的,拥有全球业务的企业,那是有很多变化和讨论空间的。
我举个简单例子,《数据安全法》出台后,字节跳动正在推动数据跨境流动“第一案”。这件事情的背景是,国内的视频内容比美国量大得多,生态丰富程度也比美国强得多,抖音的数据量10倍于Tik Tok,字节跳动因此希望能够以国内数据为材料,以不受限制的国外算力来训练人工智能大模型。
其实美国的顶级科技企业也一样,像英伟达这样的算力提供者,也有很强的冲动在中国市场销售产品。这是一个很有意思的话题,美国的巨头们也正在面临一个国家立场和自身价值观的冲突问题,因为他们要做全球生意,特别是要支持全球化。
像可口可乐、惠普、IBM、微软、谷歌、Facebook、英伟达等等这些全球巨头,都是曾经超越了国家之间的冲突,业务遍布全球,美国本土生意只占20%-30%,中国巨大的市场在这里摆着,他们想放弃也放弃不了。
在这个问题上我是乐观的,只要我们愿意坚持开放和交流,以中国人的勤劳和智慧,必能将全世界资源为我所用。
科工力量:大模型需要那么多算力,它有明显的基础设施特征,边际成本是递减的,有很强的规模效应。国外的发展现状是,由跨国巨头或者巨头联盟来提供这样一个公共基础设施,供全球使用,作为中国来说,是否需要新型举国体制才能与之抗衡?
林军:超级计算机和算力网络无疑是国家关键的基础建设,其重要性甚至可以比肩核武器。
中国可能的确还没有能力率先造出这件“核武器”,但是我们有可能在别人造出核武器的情况下,跟随造出核武器,只要有交流和信息的传递,就不可能阻断技术的扩散。
高文老师领衔鹏城实验室,从一开始就围绕为华为提供算力基础设施这项使命来建设。它是一个结合科研目标和产业转化为导向的实验室,这是一种新的机制,传统的大学可能更多围绕科研目标,而鹏城实验室同时面向产业,有自己的工程化管理能力,集中了全国和全球最好的人才,可以说是“新型举国体制”的一个代表。
科工力量:中国人工智能发展有高端人才不足的短板,同时拥有大批优秀的年轻人,如何看待这个局面?对有志于投身人工智能领域的年轻人,您有什么建议?
林军:第一,在人工智能方面,中国拥有全世界最好的高等教育人才批量培养体系;第二,中国缺少大师,这是两个事实。
顺便一提,美国方面和我们相反,他们有大师成长的体系,但是在人才大批量培养方面不行。
这是有历史渊源的,世界人工智能在这波起势前,曾经两起两落,中国的人工智能发展是在第二波人工智能浪潮开始的时候起步的,所以天生就比世界水平晚了一个周期,这也是我们现在缺乏大师的原因。
但是中国在应用层面拥有独一无二的人才培养机制,现在还拥有全球独一无二的丰富应用场景。2016年前后,中国出现了机器视觉(CV)四小龙,为什么它们首先出现在中国,而没有出现在美国呢?机器视觉落地往往是算法有了,需要针对特定场景进行具体的工程化适配调参,在这件事情上,美国的人力成本很高,而1979年以来,中国培养出了一批基础比较扎实,擅长解决场景问题的人才,落地场景也更丰富。
未来在计算机领域,算力越来越成为核心资源,而算法将在商业上成为新的驱动力。所以,中国人工智能的业者如果想有所作为的话,我的建议是,选定算力或者算法方向,年轻的时候到海外走走,见见世面,在海外获得一定成就之后回国发展,这仍然是一个快捷高效的路径。
科工力量:这本书的写作过程中有没有一些遗憾?
林军:我们想说一个挺感伤的事情。在这本书的采访和编辑出版过程中,就有一些前辈老先生离开了我们。在中国科技史上,通过我们这次小小的努力,留下了一些先行者的珍贵史料。
董振东
著名中文信息处理专家、知网发明人。2019年2月逝世。
第十五章“306 渐入佳境”中提及在机器翻译中的相关贡献。
Thomas Huang
华人计算机视觉泰斗,桃李满天下。2020年4月逝世。
在第六章“计算机视觉青出于蓝”中有专门一节。
刘叙华
中国人工智能研究领域开拓者、吉林大学教授。1994年脑出血进入植物人状态。2020年5月逝世。
第一章“符号主义与数学家”中提及刘叙华作为王湘浩的主要助手对早期AI的推动。
边肇祺
模式识别先驱、《模式识别》教材编著者。2021年3月逝世。
第三章讲模式识别和第七章讲清华AI研究均有提及。
许孔时
计算机软件科学家,中国科学院软件研究所创所所长。2021年9月逝世。
第一章“中国的达特茅斯会议”中提及许孔时为1979年吉林大学CCF会议的小组成员;第五章“计算理论的春天和计算语言学兴起”中提及许孔时对马希文的帮助。
俞士汶
计算语言学先驱、北京大学计算语言所前所长。2021年11月逝世。
第五章“计算理论的春天和计算语言学兴起”中提及在马希文出国后主持计算语言所的工作。
刘开瑛
著名自然语言处理领域学者,山西大学教授。2022年3月逝世。
第五章“计算理论的春天和计算语言学兴起”中提及。
李三立
中国工程院院士、清华大学计算机系原系主任,我国微机结构学术带头人。2022年3月逝世。
第七章“清华大学的人工智能研究”中提及在早期清华人工智能建设中起的作用。
孙剑
2022年6月逝世。
在第六章“计算机视觉青出于蓝”中提到郑南宁的时候提到了孙剑。
刘倬
中国机器翻译开山鼻祖,NLP先行者。2022年9月逝世。
第五章“计算理论的春天和计算语言学兴起”中提及。
杨叔子
机械工程专家、教育家、华中科技大学前校长。2022年11月逝世。
在第九章“机器人的曲折向前”中有提到杨叔子作为学术带头人对华中工学院(华中科技大学)机器人领域的贡献。
涂序彦
自动控制和人工智能领域著名科学家、中国人工智能学科的主要奠基人,中国人工智能学会前理事长。2023年3月逝世。
第二章“中国人工智能学会的筹备”和第四章“专家系统的井喷”中均提到涂序彦的相关工作和在早期人工智能研究者群体中的突出位置。
更多内容,点击下方关注:
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
微信扫码关注该文公众号作者