Redian新闻
>
中国的OpenAI,这群清华人不简单

中国的OpenAI,这群清华人不简单

社会



作者 | 南风窗记者 朱秋雨



10月的倒数第二天,美国总统拜登签订了一则行政命令,关于推出美国首套生成式人工智能的监管规定。


这是美国科技界近日吵得最凶的话题。因为预感到人工智能的威胁,拜登要求,美国多个政府机构制定标准,防止AI被用于制造生物或核武器等威胁。


在大洋彼岸的中国,对于AI的安全与价值,在这次浪潮中被反复提起。


智谱AI的CEO张鹏,也在长期思考着这些问题:AI,目前为止普通人摸不着的技术,如何才能正确判断它的价值。他的公司由清华大学知识工程实验室(KEG)孵化,在2023年一举成为中国AI明星企业之一。


智谱AICEO张鹏 / 张文亮 摄 


这一年,智谱AI获得了25亿人民币的投资。投资方集合一众大厂:美团、蚂蚁、阿里、腾讯。


令互联网大厂竞相跟投的,不止是清华系的“背景”。


这家创业公司最特别的是,它拥有与国际顶级机构不一样的技术路径,GLM(General Language Model),一个独属于中国的自研路径。


回到2022年3月。一篇7位中国作者合写的论文发布,轰动学界。


他们在文中大胆指出,目前所有的预训练模型框架中,都有各自的缺陷。比如,众所周知的GPT,原理是根据前一个词预测后面词的出现概率,生成了答案。这是一个单向的过程,不利于机器理解语言。


而世界级大厂谷歌提出的Bert模型框架,是在一句话里挖空一个单词,让机器学会完形填空。它却又不利于迅速生成答案。


“我们提出了一种通用语言模型(GLM)来应对这一挑战。”在论文里,一个全新的大模型路径被提出。紧接着,2022年8月,智谱AI对外发布,基于GLM的1300亿参数开源大模型GLM-130B。这是当年全亚洲唯一入选斯坦福评测的主流大模型。


一切就像命运般“赌”对了。


三个月后,这个年轻的创业公司随着ChatGPT的发布备受瞩目。有人形容,这是最像OpenAI的中国公司,研究背景强,同样追求更远的事情——让机器像人一样思考。


面对火热的关注,毕业于清华的张鹏却很冷静,习惯反思。他告诉南风窗,早在2022年中旬,团队已经预料到了这一轮技术带来的爆发。但当下的AI大模型虽然迭代迅速,仍旧面临如何创造新价值的问题。


他预想了很多种情况的发生。如果有一天,AI的进步真的让技术持有者面临奥本海默的抉择,张鹏说,他会坚持一个原则:Don' t do evil。


“基于已有认知情况,不要作恶。”


以下是南风窗与张鹏的对话:



ALL in 大模型

南风窗:从2019年创业到现在,这几年你自己有什么感受的变化?尤其是AI行业经历了几年的“冷板凳”,今年大家的关注度突然间上升了那么多。


张鹏:我的感觉跟你的不太一样。回溯我国,人工智能产业更多在2012年随着“AI四小龙”的兴起开始进入市场。只有十几年发展时间,速度却非常快。在我眼里,人工智能领域一直是快速上扬的进程。当然,以前在学校,我看得更多是全球最顶尖的研究成果,感知上和国内的市场可能是两码事。


所以,我没觉得AI是一个“冷板凳”。但ChatGPT出现后,确实改变了一些事情,让人工智能行业从过去单在技术上推进,到如今整个产业对AI的关注。这是两条线。两条线交汇到一起,形成现在这个局面。



南风窗:上述我偏向投资的角度,今年对AI领域的投资确实更热一点。回看三年前,2020年6月11日,GPT-3发布,这是一个学术和产业界关注到的大事。这一天刚好是智谱AI成立一周年。“生日”碰上GPT-3的发布,有改变智谱AI的命运轨迹吗?


张鹏:我们2016、2017年开始研究AI产业时就一直在讨论,到底应该做什么事。上一代的AI技术(即行业大模型)不是我们想要的,因为预见得到技术天花板。果然,2018、2019年前后,AI企业纷纷到达发展的天花板,陷入瓶颈。


2019年时智谱成立。我们很明确的想法是,做下一代的人工智能。这就是清华大学人工智能研究院名誉院长张钹院士所说的,要发展第三代人工智能—“认知智能”。与张钹院士聊时,我们想清楚一件事,AI未来的方向里一定要有两条腿:一是数据驱动,另一个是知识驱动。从筹备创业一直到2020年,我们都在这个框架下用各种技术,如信息学习、数据挖掘、训练模型,推动认知智能的落地。


2020年,智谱成立一周年,正好碰上GPT-3的发布。那一天,我们请了张钹院士等人座谈,讨论的便是:GPT-3为代表的大模型,是不是我们所追寻的认知智能可能的解决方案。


我们接着做了一些小规模的实验,取得了一点成果。但到2021年初,我们发现,世界顶尖的水平领先我们挺多的。既然要去做下一代的技术,不上不下还是不行,应该瞄准最先进的技术去追赶;于是开始考虑,投入资源做一个世界顶级水平、类似GPT-3的千亿级模型。


那时候,公司内部讨论最多的问题便是,要不要投这么多钱,做一个无法保证成功的大模型。经过对我们实力的评估,我们最终决定还是冒一点风险。做出投入的最本质原因,还是我们笃定AI大模型会是未来很重要的一件事。


当时国内这样认知的人非常少。别说创业公司了,大厂可能都很少。


智谱AI提出Model as a Service(MaaS)的市场理念,打造了认知大模型平台以及数字人和科技情报产品 / 图源:智谱AI官网


南风窗:你刚刚说,想对标GPT-3。智谱AI最特别的一点就是GLM的路径。当时就确定,想走的路径是区别于谷歌和OpenAI,基于中国人自研的GLM路径吗?


张鹏:对。我们投入大成本做千亿模型的时候,在算法的研究层面已经完成了。GLM的路径在百亿模型上验证成功了,区别是我们没做千亿参数模型的验证,并不确定基于GLM能不能让我们超越GPT-3的水平。


南风窗:如此看来,百亿参数级的模型,对很多创业公司是可以接受的成本。但如果跨到千亿级参数,这就是一个飙升的难度,是决定一个公司的攸关时刻。


张鹏:对,一个是公司从经营层面怎么来决策,是否要冒这个风险。


另一个更大的层面,从百亿到千亿参数的研发,难度不是简单的乘10倍。很多技术上的风险和问题,不是说有决心、有钱,敢冒风险就能解决,这是大家比较害怕的事,也是到现在为止能跑出千亿模型的机构还非常少的原因之一。


南风窗:GLM还有一个特点,它比较节约算力,国产芯片也可以使用。这个特点怎么做到的?


张鹏:这就是所谓的“穷人的孩子早当家”。2020年底、2021年初做大模型研发时,算力不够,我们只能到处去借。借到的算力要一点一点地抠出来,分给研究和工程。


所以我们天然地对资源的浪费挺关注。当时的模型除了训练,还进行算法优化,做了很多提速量化压缩的辅助性工作。这些工作的目的是为了降成本,让大家更好地使用它。


而且我们必须笃信能这么做,否则,我们资源厚度不如国外的企业,起步比人家晚。在又不如人家的前提下,如果不做出一些创新,怎么可能追得上?


电影《黑客帝国:矩阵重启》剧照


南风窗:背靠清华,智谱在中国的发展有一种“天之骄子”的感觉,这三年,智谱在发展的过程中有遇到灰暗的时刻吗?


张鹏:我们没有认为自己是天才。刚创业出来跟投资人聊天,他们最大的一个质疑就是:“你们一帮从学校出来的,整个创业院队又不年轻,你们凭什么能成功?没有一个人有市场和创业的经验,凭什么能成功?”一开始其实挺困难的,得面对这些问题。


南风窗:所以与外界想象的不同,清华系在投资者面前没有太多的加成?


张鹏:“清华系”能起到锦上添花的作用。它不能是一个创业公司的全部,甚至都不能是你的最重要的三件事情之一。对于我们想做的事情而言,一开始资源方面确实紧缺。




AI不是用来砸已有钉子

南风窗:上述来看,智谱AI的气质还是与OpenAI有些相似,创业公司,注重技术和研究,靠技术夺得头筹。但你之前在受访时强调,智谱不是中国版OpenAI,你为什么会这样说?


张鹏:这里我要纠正一下外界的解读。从我的角度看,我们确实很多方向上的选择和决策,都和OpenAI有点像。我之前说的是,不要盯着OpenAI实现阶段性的目标。也就是说,不要把我们做的事情定义成中国版ChatGPT。我们眼里,ChatGPT只是一个阶段性的成果。它不是我们的终极目标。


我们的终极目标和OpenAI很接近,那就是实现通用人工智能。OpenAI毕竟还是比我们领先,所以在很多选择上,我们第一步就是虚心学习。他们做了很多创新,如果我们觉得有道理的,就想办法去做。



南风窗:智谱与OpenAI有相似的目标,实现通用人工智能(AGI)。你的AGI定义是什么样的?现在我们有了涌现很多智能的大语言模型,你觉得实现通用人工智能的下一个突破的点在哪里?


张鹏:通用人工智能,在不同的专家和学者眼里,有不同的解读。很难说清楚AGI的具体定义是什么。但我相信一种更简单的描绘:拿人做对比。像图灵测试,通过行为学的定义,用对话的方式让人分辨机器和人(如果人分辨不清哪个是机器哪个是人,说明机器通过了测试)。


目前的AI早就通过了“图灵测试”,但还有很多问题,比如容易出现幻觉和有毒性的词汇,逻辑能力也不足。这些还有赖于工程问题的解决。


今后我认为还有几个重要的方向:


一是多模态。人类的智能包含了很多能力,视觉、听觉等。我们在尝试这些能力跟大模型融合。这是未来很重要的方向。


第二,如同红杉资本在《Generative AI' s Act Two》的文章中所说的,生成式AI的故事进入了第二幕。所谓的第二幕就是应用。现在,大模型的智能能力已经初步具备了,具备基本的人际沟通能力了。但怎么把它用到实际当中去,产生真正价值,怎么来做这个事情,还待解答。


第三,上述事情假如我们都能实现了,下一步我们该考虑,AI是否不仅达到人的水平,还能超过人。也就是Super Intelligence(超级人工智能)的出现。


智谱AI参与研发制作的“冬奥手语播报数字人”助力北京冬奥会 / 图源:智谱AI官网


南风窗:刚刚我们一直在聊说落地和技术,这是智谱的两条腿。大模型在国内掀起浪潮半年多了,想知道在未来,这两条腿共同前进的目标是什么?


张鹏:有一个比较抽象的目标,那就是让大模型的能力,真正创造出一些比较大价值的应用。面向消费者端,那便是创造一个Super App(超级应用)。


在面向企业端,即在应用场景给客户带来更大的价值。我们常提的叫“降本增效”,后面我还补了两个词,叫作“提质”,提升质量;还有,“创新”。


我最近和行业的人聊,有新的想法。大家都认为,大模型好比一个威力巨大的锤子。有人曾经以为说锤子可以把所有原来的钉子全部砸一遍。原来所有事情都可以拿AI重做一遍,对吧?但我更强调,不要把已有的钉子全部砸一遍,最终收获还是原来那么多的价值。


锤子除了能用来把原来钉子砸一遍以外,其实还有一个可能性:用来砸墙,砸天花板。砸出来的窟窿,你会看到更多的空间,更多的钉子。


南风窗:要创造新的东西。


张鹏:对。要有新的东西,有新的空间产生。这才是我们看重这一波技术革新带来的机会。



南风窗:“新的东西”,有具体的想法吗?


张鹏:这个阶段有一些苗头出现。但更多的还是需要整个生态,合作伙伴们包括客户们一起摸索,寻找新的可能。这也涉及认知问题。大家的注意力不能在已知的这些钉子上,没有人去想说有没有可能有新的定位。或者我们有没有可能把这堵墙拆了,让现实世界变得更好,空间会变得更大。


南风窗:像硅谷今年下半年,聊得最多的除了AIGC(AI生成内容)以外,便是AI agent(AI智能体,让AI模拟人类行为和决策过程)。你怎么看AI agent?这会是一个“砸墙”比较重要的方向吗?


张鹏:智能体从技术角度来看肯定是很重要的领域。但是它还是技术层面的新东西,并不是我刚才说的,创造了一个新的市场,或者创造了一个新需求。这个技术能创造出什么东西来,还得再去琢磨。




“不要作恶”

南风窗:智谱AI在2022年时已经做好了千亿大模型。2022年8月,智谱发布高精度双语稠密千亿大模型GLM-130B。紧接着,11月30日,ChatGPT发布,引起众人对生成式AI的狂欢和追捧。ChatGPT发布后,有没有意识到万众瞩目的AI时刻就要发生了?


张鹏:2022年8月,智谱发布千亿级大模型时,我们自己内部就有一个预测,在半年最晚不超过一年的时间里,也就是在2022年底或者2023年初会爆发。


这就是一种技术的客观规律。技术发展到了点上,所有的积累爆发出来的能量,会有持续爆发的过程。只要掌握到数据和这种客观的因素,就可以预测未来一段时间的走势。


智谱AI官网截图


南风窗:你说的预测的“爆发”,是指像ChatGPT带来的这样,AI已经可以影响到公众层面对新技术的一个认知上了吗?


张鹏:对,不止停留在开发者手里,而是以实际的应用走入公众的视野。ChatGPT出来后,我开玩笑说,这还帮了我们一个忙。去年8月,我们把GLM-130B发布出来,大概10月份开始做新一轮的融资。当时跟很多投资人在聊,别人都会问,你这个东西看起来好像还不错,但能做什么、怎么能挣钱?接着OpenAI的ChatGPT上线,帮我们回答了这些问题。


南风窗:经历了这一年关注和教育,现在企业对大模型的认知和年初的时候会不会有区别?


张鹏:应该来说,我们越早接触和达成合作的客户,对于AI的认知反而越长远。这一点,可能互联网厂商会更敏感。因为他们本身价值计算的逻辑就是往未来看,可以烧钱可以亏,但是绝对不允许错过。


因为一旦错过,可能错过的就是一个时代,想要再进去抢滩会很难。


南风窗:回看一路,智谱采用的是中国自研技术,一直对标的也是OpenAI。在中美的AI大模型竞争中,到现在为止你觉得差距还有多少?


张鹏:我们承认跟世界顶级的水平还是有差距的,但我们有信心去追赶这个差距。


智谱AI CEO张鹏在全球数字经济大会人工智能高峰论坛上发表主题演讲 / 图源:视觉中国


南风窗:回到你个人层面上,这半年多,大家都会进入技术的过度兴奋和冷静两者交替的状态,你如何平衡外界的兴奋和对事情可能走向的谨慎?


张鹏:如果用一个词来形容,那就是笃信。信当然就是相信这件事情,大模型一定是未来的大方向,能创造更大的价值。“笃”是一种态度,踏实、审慎。我们的相信要基于对这件事情的理解和钻研,并不是狂热、没有根基的。


南风窗:你是比较乐观的人?


张鹏:在这个事上,我还是比较乐观。


南风窗:在人工智能行业这么多年,会有一个方针或者目标,给予你相信的力量吗?


张鹏:我一直在想一件事,人工智能到底把它搬到现实社会当中,会是一个什么样的?最终的目的是什么?


答案也很简单,让社会或者里面的人更美好。比如大家的工作更轻松一些,有更多的闲余时间去享受生活,而不是一天天996。我想过很多的产品,像电影里体现的,人工智能的助手。这些能不能实现?我觉得应该快了。


我用一个词描述过这个梦想,叫人机共生。比如在现实世界,可能有聪明的机器人,甚至是类人机器人,这些智能的设备可以让你的生活更方便美好。老人不再担心说没有人陪伴,独生子女不担心没有人跟他/她作伴了。以后在现实世界外,还有虚拟世界的叠加,要是这样,世界是不是会更好一些?


《爱,死亡和机器人》 剧照


南风窗:无意质疑你。但技术本身还会带来负面性。你会担心自己能影响更多人的生活以后,就像奥本海默一样,在一些关键的节点,面临着是让技术发展,还是按下暂停键的抉择。如果是这样,你会继续希望这个技术是往前迭代的吗?


张鹏:这时候要尽量审慎。有一句话叫don't do evil,在你的认知范围之内,不要作恶。当然有时候就像奥本海默一样,他最初的目的也不是为了作恶。所以产生恶果有时候不一定由你控制。但要尽全力确保这个事情在人的意愿里。在做事情过程当中,将一切后果考虑周全。


文中配图部分来源于视觉中国,部分来源于网络



-END-



编辑 | 向由

排版 | 八斤



2024年南风窗杂志全年订阅

扫描二维码即可直接订阅



南风窗原创访谈节目

 《致敬实干家》 

人生如远征,致敬实干家。



南风窗新媒体 出品

未经授权 禁止转载

欢迎分享至 朋友圈


投稿、投简历:[email protected]

广告、商务合作:

 nfcnewmedia


扫描二维码 即刻秒杀



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
38岁的OpenAI创始人兼CEO被开除!宫斗背后谁最心急?再爆大料!果然,章子怡这人不简单!!!如何设计一个安全好用的OpenApi被员工抵制的OpenAI新任CEO,曾称在微软工作是出卖灵魂风投争购不上市的OpenAI员工股,估值高达900亿美元棒子国政坛 “地震”三连发,不简单!四大名香独占其三,这款小众香不简单最好的7B模型易主,笔记本轻松跑,免费开源可商用,来自“欧洲的OpenAI”给动物“拍照片”,一点也不简单~九月初日式蒲烧茄子 - Kabayaki Eggplant。最好的料汁配方,分分钟做出味香色美,软糯香甜的佳肴。中国会有自己的OpenAI吗?有本事嫁豪门,还有本事过得爽,这个女星手段不简单一碗牛肉面的试验科学年入13亿美元的OpenAI低调换价值观!但比AGI更重要的是什么?合二为一,这种糕点不简单闯关、逆袭、斜杠、跨越阶层,这个女子不简单专访丨积家CEO Catherine Rénier:情感联结和艺术表达对腕表也至关重要中国这个省会,真的不简单!成都翘臀语文老师吸引无数少女?这个男人不简单!简单菜“不简单”:超7万家预制菜企业如何竞逐红海被微软“养大”的OpenAI,决定反噬微软?歪屁股天后不简单?​口红一哥立场不正?​海绵宝宝状态好?当三女卖惨?甜姐不爱炒CP?德堡路、奥纳路、华京路……这些路名不简单!A-Level心理学不简单,相关大学专业的申请也很难。章子怡这人不简单!全民反間谍,草木皆兵.深圳的这群程序员,很不简单哪个少年不多情哪个少女不怀春--美女归来一农民娶了一个懒老婆,她不做饭,也不同房,10年后,老农发现,老婆的身份不简单"妈妈让我来自首",7岁男孩在派出所写下"bǎozhèng书"这群达拉斯大妈,疯狂爱上来自中国的它!天天组团白石湖李佳琦人设崩塌的真相,并不简单...被微软“养大”的OpenAI,决定反噬微软OpenAI终于Open一回:DALL-E 3论文公布、上线ChatGPT,作者一半是华人
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。