对话纪源Alpha:AI技术如何在不确定性中不断进步 | 亮马桥会客室
本期亮马桥会客室(搜索“亮马桥小纪”视频号及B站可以查看视频),我们邀请到了纪源Alpha的两位专家,分别是Datastrato创始人堵俊平和星鲸科技创始人徐串,二位在大数据和AI领域深耕多年,有着丰富的技术背景和业界经验。本期纪源Alpha×亮马桥小纪,我们将一起聊聊OpenAI的成功与它背后的大模型赛道——大模型成功有哪些关键要素?而大模型未来又将如何发展,它又将如何改变我们与机器的关系?
本文是亮马桥小纪AI系列的第五篇。
Datastrato创始人 堵俊平:我们回顾一下OpenAI这家公司,2014、2015年我在硅谷的时候就关注过它,那时它是非盈利模式,持续地在AI这个领域做相应的探索,它不希望AI的技术被一个很大的公司或一两家大公司所垄断,所以刚开始的时候它的动机、初创都是非常好的。从那个时候到现在已经很多年过去了,甚至到GPT-1、GPT-2发布的时候,这个公司还没有太大的声响,一直到GPT-3才一鸣惊人。
星鲸科技创始人 徐串:GPT并不是一下子就达到现在这个水平的,OpenAI很早就出了GPT-1、GPT-2、GPT-3。GPT-1和GPT-2大家都觉得不太行,GPT-3好像还行。当时在国内大家都走的是Google的BERT那条路线,在判断你的意图是什么这件事情上,它做得特别好。然后你可以在各种行业里去微调它,使得它符合这个行业。GPT的路线一直是想做通用的人工智能,就是只用自然语言和对话,它就可以完成这些东西。这个可能是一条比较艰难的路线,所以它一直在这上面探索。经过这么多年的积累以后,它真正地找到了如何教它才能使得大模型的能力能够被激发出来。我觉得OpenAI最大的贡献在于,它证明了这件事情是可行的,以前从来没人相信这件事情做得到。
Datastrato创始人 堵俊平:实际上OpenAI的成功不仅是科学家的成功,我个人认为是一帮靠谱的工程师,既有工程师的脚踏实际、能落地的能力,也有科学家愿意去探索的能力。其实从大模型到后面的这个爆点,实际上是一个应用,它并不是一个模型。但是在引爆的点上,你往回退的话,你会发现很长时间面临不确定的风险,不确定的投入产出比,是否有人愿意出钱、愿意贡献自己的时间、才智去做这个事,我认为这个恰恰是其他创新性的Start-ups要学习的。大厂很擅长在有一个明确的目标和目的的情况下去做一件事,但是这个明确的目标和目的往往会使你的创新不够。你的创新的边界往往来自于目标不那么明确,就是一个模模糊糊的方向的时候,这个时候你的创新程度是最高,你的创新值是拉满的,但是你的结果有90%、95%的概率是失败的,那你愿不愿意为这个5%、10%的可能性买单?
星鲸科技创始人 徐串:我觉得中文世界需要自己的大模型,这个毫无疑问,现在我们看到GPT在中文上的表现没有和英文一样好,如果你想把中文做好,就需要大量的中文语料进行训练。如果依赖OpenAI来做,一定不会是它的第一优先级,因为它的主要市场在欧美,是以英语为主的,中文只会是附带做的,所以它的投入不可能那么大。如果真的想要一个很好的中文模型,必须是中国自己做。
星鲸科技创始人 徐串:工程师想的一般都是怎么把一个技术转变为现实的产品,这就是落地的能力。但科学家需要一些探索的精神,很多时候并不知道方向在哪儿,你要不停地去思考,要有自己坚定的理念,要觉得这个方向是能做出来的,以及在发现做不出来以后马上转到另外一个方向上去。
星鲸科技创始人 徐串:这里面唯一的门槛在于哪里?首先算力有很大的门槛,真正要做出一个这样的大模型,可能门票是10亿人民币。然后能不能做出来,还要看你这方面的经验之类的,因为你在训练这个模型的过程中会遇到很多很多的问题,就像有时候崩了,突然开始胡说八道了,怎么样让它在各种反馈上更像人类的思考方式,这需要很细致的工作,没办法一下子就突破。
Datastrato创始人 堵俊平:我觉得这里面可以找几个特质。首先得看人才密度,经历了大模型这波还能生存下来的,一定是人才密度比较高的公司。第二点是数据,它一定有大量的数据作为储备,有助于模型训练的样本和它的精度和调优的一系列工作。第三个是长期的投入,并不指望这样一个过程是6个月到12个月,大模型的这种探索一定不会是一帆风顺的,这个公司要有屡败屡战的气质。
Datastrato创始人 堵俊平:初期肯定是百花齐放,可以看各个大厂或者一些start-ups(初创企业)都在做这个领域。我觉得在领域内探索肯定是好的事情,但在百花齐放之后,我认为接下来可能是一个收敛的过程,不会每个模型都成功。那么我希望当前在做这方面的挑战和尝试的人要屡败屡战,哪怕我们搞了10个、20个模型,可能最后只剩下两个,但是持续地创新、有一个更好的基础大模型,我认为是全中国甚至是全球、全人类的福音。
星鲸科技创始人 徐串:大模型这个市场其实容不下太多的公司,因为最终其实要考虑投入产出比,以及这种投入对你的价值是什么。现在大家只是在赶风口,随着市场的竞争,我觉得最后可能就剩下两三家。
Datastrato创始人 堵俊平:除了我们需要基础的大模型之外,在大模型的基础上面向某个行业或者某一类的应用,会有一个收敛的过程,大模型会收敛成一个中度的模型,然后结合这个行业的特点、数据、以及经验,会在未来对我们人类社会以及千行百业产生持续的影响。
星鲸科技创始人 徐串:大模型对人的替代是更加全面、更加通用的,因为你会发现很多职业没必要存在了。被大模型替代的人可能相对会痛苦一些,因为TA们要面临职业的转型。但对于整个社会来说影响应该不会有那么大,原因在于一旦一个职业被取代后,会有新的岗位出现,新的岗位能够满足需求。像人类在工业革命的时候,工厂里不用那么多工人了,那相应的人口就一点事情都没有做了吗,相反的,有很多新的职业出现了。
星鲸科技创始人 徐串:我总是觉得计算机是一个工具,是用来解放人类的生产力,一旦生产力被解放了以后,人就变得特别自由了。这个自由不是你可以想做什么就做什么,而是你可以做很多原来做不到的事情。
Datastrato创始人 堵俊平:再往后看5到10年,10到20年,可能像现在Elon Musk(埃隆·马斯克)在探索的这些领域,比如让人类成为一个多星球的生物,这些事情都是很有意义的。我记得阿西莫夫的《银河帝国》讲过,当你发现机器人和AI可以帮你做很多事情的时候,人其实是可以充分调用这个星球的所有资源的,人类的生活半径,是可以扩展到地球之外的区域的。我觉得这些都是未来发展的可能性。
微信扫码关注该文公众号作者