Redian新闻
>
中国的OpenAI,这群清华人不简单

中国的OpenAI,这群清华人不简单

社会



作者 | 南风窗记者 朱秋雨



10月的倒数第二天,美国总统拜登签订了一则行政命令,关于推出美国首套生成式人工智能的监管规定。


这是美国科技界近日吵得最凶的话题。因为预感到人工智能的威胁,拜登要求,美国多个政府机构制定标准,防止AI被用于制造生物或核武器等威胁。


在大洋彼岸的中国,对于AI的安全与价值,在这次浪潮中被反复提起。


智谱AI的CEO张鹏,也在长期思考着这些问题:AI,目前为止普通人摸不着的技术,如何才能正确判断它的价值。他的公司由清华大学知识工程实验室(KEG)孵化,在2023年一举成为中国AI明星企业之一。


智谱AICEO张鹏 / 张文亮 摄 


这一年,智谱AI获得了25亿人民币的投资。投资方集合一众大厂:美团、蚂蚁、阿里、腾讯。


令互联网大厂竞相跟投的,不止是清华系的“背景”。


这家创业公司最特别的是,它拥有与国际顶级机构不一样的技术路径,GLM(General Language Model),一个独属于中国的自研路径。


回到2022年3月。一篇7位中国作者合写的论文发布,轰动学界。


他们在文中大胆指出,目前所有的预训练模型框架中,都有各自的缺陷。比如,众所周知的GPT,原理是根据前一个词预测后面词的出现概率,生成了答案。这是一个单向的过程,不利于机器理解语言。


而世界级大厂谷歌提出的Bert模型框架,是在一句话里挖空一个单词,让机器学会完形填空。它却又不利于迅速生成答案。


“我们提出了一种通用语言模型(GLM)来应对这一挑战。”在论文里,一个全新的大模型路径被提出。紧接着,2022年8月,智谱AI对外发布,基于GLM的1300亿参数开源大模型GLM-130B。这是当年全亚洲唯一入选斯坦福评测的主流大模型。


一切就像命运般“赌”对了。


三个月后,这个年轻的创业公司随着ChatGPT的发布备受瞩目。有人形容,这是最像OpenAI的中国公司,研究背景强,同样追求更远的事情——让机器像人一样思考。


面对火热的关注,毕业于清华的张鹏却很冷静,习惯反思。他告诉南风窗,早在2022年中旬,团队已经预料到了这一轮技术带来的爆发。但当下的AI大模型虽然迭代迅速,仍旧面临如何创造新价值的问题。


他预想了很多种情况的发生。如果有一天,AI的进步真的让技术持有者面临奥本海默的抉择,张鹏说,他会坚持一个原则:Don' t do evil。


“基于已有认知情况,不要作恶。”


以下是南风窗与张鹏的对话:



ALL in 大模型

南风窗:从2019年创业到现在,这几年你自己有什么感受的变化?尤其是AI行业经历了几年的“冷板凳”,今年大家的关注度突然间上升了那么多。


张鹏:我的感觉跟你的不太一样。回溯我国,人工智能产业更多在2012年随着“AI四小龙”的兴起开始进入市场。只有十几年发展时间,速度却非常快。在我眼里,人工智能领域一直是快速上扬的进程。当然,以前在学校,我看得更多是全球最顶尖的研究成果,感知上和国内的市场可能是两码事。


所以,我没觉得AI是一个“冷板凳”。但ChatGPT出现后,确实改变了一些事情,让人工智能行业从过去单在技术上推进,到如今整个产业对AI的关注。这是两条线。两条线交汇到一起,形成现在这个局面。



南风窗:上述我偏向投资的角度,今年对AI领域的投资确实更热一点。回看三年前,2020年6月11日,GPT-3发布,这是一个学术和产业界关注到的大事。这一天刚好是智谱AI成立一周年。“生日”碰上GPT-3的发布,有改变智谱AI的命运轨迹吗?


张鹏:我们2016、2017年开始研究AI产业时就一直在讨论,到底应该做什么事。上一代的AI技术(即行业大模型)不是我们想要的,因为预见得到技术天花板。果然,2018、2019年前后,AI企业纷纷到达发展的天花板,陷入瓶颈。


2019年时智谱成立。我们很明确的想法是,做下一代的人工智能。这就是清华大学人工智能研究院名誉院长张钹院士所说的,要发展第三代人工智能—“认知智能”。与张钹院士聊时,我们想清楚一件事,AI未来的方向里一定要有两条腿:一是数据驱动,另一个是知识驱动。从筹备创业一直到2020年,我们都在这个框架下用各种技术,如信息学习、数据挖掘、训练模型,推动认知智能的落地。


2020年,智谱成立一周年,正好碰上GPT-3的发布。那一天,我们请了张钹院士等人座谈,讨论的便是:GPT-3为代表的大模型,是不是我们所追寻的认知智能可能的解决方案。


我们接着做了一些小规模的实验,取得了一点成果。但到2021年初,我们发现,世界顶尖的水平领先我们挺多的。既然要去做下一代的技术,不上不下还是不行,应该瞄准最先进的技术去追赶;于是开始考虑,投入资源做一个世界顶级水平、类似GPT-3的千亿级模型。


那时候,公司内部讨论最多的问题便是,要不要投这么多钱,做一个无法保证成功的大模型。经过对我们实力的评估,我们最终决定还是冒一点风险。做出投入的最本质原因,还是我们笃定AI大模型会是未来很重要的一件事。


当时国内这样认知的人非常少。别说创业公司了,大厂可能都很少。


智谱AI提出Model as a Service(MaaS)的市场理念,打造了认知大模型平台以及数字人和科技情报产品 / 图源:智谱AI官网


南风窗:你刚刚说,想对标GPT-3。智谱AI最特别的一点就是GLM的路径。当时就确定,想走的路径是区别于谷歌和OpenAI,基于中国人自研的GLM路径吗?


张鹏:对。我们投入大成本做千亿模型的时候,在算法的研究层面已经完成了。GLM的路径在百亿模型上验证成功了,区别是我们没做千亿参数模型的验证,并不确定基于GLM能不能让我们超越GPT-3的水平。


南风窗:如此看来,百亿参数级的模型,对很多创业公司是可以接受的成本。但如果跨到千亿级参数,这就是一个飙升的难度,是决定一个公司的攸关时刻。


张鹏:对,一个是公司从经营层面怎么来决策,是否要冒这个风险。


另一个更大的层面,从百亿到千亿参数的研发,难度不是简单的乘10倍。很多技术上的风险和问题,不是说有决心、有钱,敢冒风险就能解决,这是大家比较害怕的事,也是到现在为止能跑出千亿模型的机构还非常少的原因之一。


南风窗:GLM还有一个特点,它比较节约算力,国产芯片也可以使用。这个特点怎么做到的?


张鹏:这就是所谓的“穷人的孩子早当家”。2020年底、2021年初做大模型研发时,算力不够,我们只能到处去借。借到的算力要一点一点地抠出来,分给研究和工程。


所以我们天然地对资源的浪费挺关注。当时的模型除了训练,还进行算法优化,做了很多提速量化压缩的辅助性工作。这些工作的目的是为了降成本,让大家更好地使用它。


而且我们必须笃信能这么做,否则,我们资源厚度不如国外的企业,起步比人家晚。在又不如人家的前提下,如果不做出一些创新,怎么可能追得上?


电影《黑客帝国:矩阵重启》剧照


南风窗:背靠清华,智谱在中国的发展有一种“天之骄子”的感觉,这三年,智谱在发展的过程中有遇到灰暗的时刻吗?


张鹏:我们没有认为自己是天才。刚创业出来跟投资人聊天,他们最大的一个质疑就是:“你们一帮从学校出来的,整个创业院队又不年轻,你们凭什么能成功?没有一个人有市场和创业的经验,凭什么能成功?”一开始其实挺困难的,得面对这些问题。


南风窗:所以与外界想象的不同,清华系在投资者面前没有太多的加成?


张鹏:“清华系”能起到锦上添花的作用。它不能是一个创业公司的全部,甚至都不能是你的最重要的三件事情之一。对于我们想做的事情而言,一开始资源方面确实紧缺。




AI不是用来砸已有钉子

南风窗:上述来看,智谱AI的气质还是与OpenAI有些相似,创业公司,注重技术和研究,靠技术夺得头筹。但你之前在受访时强调,智谱不是中国版OpenAI,你为什么会这样说?


张鹏:这里我要纠正一下外界的解读。从我的角度看,我们确实很多方向上的选择和决策,都和OpenAI有点像。我之前说的是,不要盯着OpenAI实现阶段性的目标。也就是说,不要把我们做的事情定义成中国版ChatGPT。我们眼里,ChatGPT只是一个阶段性的成果。它不是我们的终极目标。


我们的终极目标和OpenAI很接近,那就是实现通用人工智能。OpenAI毕竟还是比我们领先,所以在很多选择上,我们第一步就是虚心学习。他们做了很多创新,如果我们觉得有道理的,就想办法去做。



南风窗:智谱与OpenAI有相似的目标,实现通用人工智能(AGI)。你的AGI定义是什么样的?现在我们有了涌现很多智能的大语言模型,你觉得实现通用人工智能的下一个突破的点在哪里?


张鹏:通用人工智能,在不同的专家和学者眼里,有不同的解读。很难说清楚AGI的具体定义是什么。但我相信一种更简单的描绘:拿人做对比。像图灵测试,通过行为学的定义,用对话的方式让人分辨机器和人(如果人分辨不清哪个是机器哪个是人,说明机器通过了测试)。


目前的AI早就通过了“图灵测试”,但还有很多问题,比如容易出现幻觉和有毒性的词汇,逻辑能力也不足。这些还有赖于工程问题的解决。


今后我认为还有几个重要的方向:


一是多模态。人类的智能包含了很多能力,视觉、听觉等。我们在尝试这些能力跟大模型融合。这是未来很重要的方向。


第二,如同红杉资本在《Generative AI' s Act Two》的文章中所说的,生成式AI的故事进入了第二幕。所谓的第二幕就是应用。现在,大模型的智能能力已经初步具备了,具备基本的人际沟通能力了。但怎么把它用到实际当中去,产生真正价值,怎么来做这个事情,还待解答。


第三,上述事情假如我们都能实现了,下一步我们该考虑,AI是否不仅达到人的水平,还能超过人。也就是Super Intelligence(超级人工智能)的出现。


智谱AI参与研发制作的“冬奥手语播报数字人”助力北京冬奥会 / 图源:智谱AI官网


南风窗:刚刚我们一直在聊说落地和技术,这是智谱的两条腿。大模型在国内掀起浪潮半年多了,想知道在未来,这两条腿共同前进的目标是什么?


张鹏:有一个比较抽象的目标,那就是让大模型的能力,真正创造出一些比较大价值的应用。面向消费者端,那便是创造一个Super App(超级应用)。


在面向企业端,即在应用场景给客户带来更大的价值。我们常提的叫“降本增效”,后面我还补了两个词,叫作“提质”,提升质量;还有,“创新”。


我最近和行业的人聊,有新的想法。大家都认为,大模型好比一个威力巨大的锤子。有人曾经以为说锤子可以把所有原来的钉子全部砸一遍。原来所有事情都可以拿AI重做一遍,对吧?但我更强调,不要把已有的钉子全部砸一遍,最终收获还是原来那么多的价值。


锤子除了能用来把原来钉子砸一遍以外,其实还有一个可能性:用来砸墙,砸天花板。砸出来的窟窿,你会看到更多的空间,更多的钉子。


南风窗:要创造新的东西。


张鹏:对。要有新的东西,有新的空间产生。这才是我们看重这一波技术革新带来的机会。



南风窗:“新的东西”,有具体的想法吗?


张鹏:这个阶段有一些苗头出现。但更多的还是需要整个生态,合作伙伴们包括客户们一起摸索,寻找新的可能。这也涉及认知问题。大家的注意力不能在已知的这些钉子上,没有人去想说有没有可能有新的定位。或者我们有没有可能把这堵墙拆了,让现实世界变得更好,空间会变得更大。


南风窗:像硅谷今年下半年,聊得最多的除了AIGC(AI生成内容)以外,便是AI agent(AI智能体,让AI模拟人类行为和决策过程)。你怎么看AI agent?这会是一个“砸墙”比较重要的方向吗?


张鹏:智能体从技术角度来看肯定是很重要的领域。但是它还是技术层面的新东西,并不是我刚才说的,创造了一个新的市场,或者创造了一个新需求。这个技术能创造出什么东西来,还得再去琢磨。




“不要作恶”

南风窗:智谱AI在2022年时已经做好了千亿大模型。2022年8月,智谱发布高精度双语稠密千亿大模型GLM-130B。紧接着,11月30日,ChatGPT发布,引起众人对生成式AI的狂欢和追捧。ChatGPT发布后,有没有意识到万众瞩目的AI时刻就要发生了?


张鹏:2022年8月,智谱发布千亿级大模型时,我们自己内部就有一个预测,在半年最晚不超过一年的时间里,也就是在2022年底或者2023年初会爆发。


这就是一种技术的客观规律。技术发展到了点上,所有的积累爆发出来的能量,会有持续爆发的过程。只要掌握到数据和这种客观的因素,就可以预测未来一段时间的走势。


智谱AI官网截图


南风窗:你说的预测的“爆发”,是指像ChatGPT带来的这样,AI已经可以影响到公众层面对新技术的一个认知上了吗?


张鹏:对,不止停留在开发者手里,而是以实际的应用走入公众的视野。ChatGPT出来后,我开玩笑说,这还帮了我们一个忙。去年8月,我们把GLM-130B发布出来,大概10月份开始做新一轮的融资。当时跟很多投资人在聊,别人都会问,你这个东西看起来好像还不错,但能做什么、怎么能挣钱?接着OpenAI的ChatGPT上线,帮我们回答了这些问题。


南风窗:经历了这一年关注和教育,现在企业对大模型的认知和年初的时候会不会有区别?


张鹏:应该来说,我们越早接触和达成合作的客户,对于AI的认知反而越长远。这一点,可能互联网厂商会更敏感。因为他们本身价值计算的逻辑就是往未来看,可以烧钱可以亏,但是绝对不允许错过。


因为一旦错过,可能错过的就是一个时代,想要再进去抢滩会很难。


南风窗:回看一路,智谱采用的是中国自研技术,一直对标的也是OpenAI。在中美的AI大模型竞争中,到现在为止你觉得差距还有多少?


张鹏:我们承认跟世界顶级的水平还是有差距的,但我们有信心去追赶这个差距。


智谱AI CEO张鹏在全球数字经济大会人工智能高峰论坛上发表主题演讲 / 图源:视觉中国


南风窗:回到你个人层面上,这半年多,大家都会进入技术的过度兴奋和冷静两者交替的状态,你如何平衡外界的兴奋和对事情可能走向的谨慎?


张鹏:如果用一个词来形容,那就是笃信。信当然就是相信这件事情,大模型一定是未来的大方向,能创造更大的价值。“笃”是一种态度,踏实、审慎。我们的相信要基于对这件事情的理解和钻研,并不是狂热、没有根基的。


南风窗:你是比较乐观的人?


张鹏:在这个事上,我还是比较乐观。


南风窗:在人工智能行业这么多年,会有一个方针或者目标,给予你相信的力量吗?


张鹏:我一直在想一件事,人工智能到底把它搬到现实社会当中,会是一个什么样的?最终的目的是什么?


答案也很简单,让社会或者里面的人更美好。比如大家的工作更轻松一些,有更多的闲余时间去享受生活,而不是一天天996。我想过很多的产品,像电影里体现的,人工智能的助手。这些能不能实现?我觉得应该快了。


我用一个词描述过这个梦想,叫人机共生。比如在现实世界,可能有聪明的机器人,甚至是类人机器人,这些智能的设备可以让你的生活更方便美好。老人不再担心说没有人陪伴,独生子女不担心没有人跟他/她作伴了。以后在现实世界外,还有虚拟世界的叠加,要是这样,世界是不是会更好一些?


《爱,死亡和机器人》 剧照


南风窗:无意质疑你。但技术本身还会带来负面性。你会担心自己能影响更多人的生活以后,就像奥本海默一样,在一些关键的节点,面临着是让技术发展,还是按下暂停键的抉择。如果是这样,你会继续希望这个技术是往前迭代的吗?


张鹏:这时候要尽量审慎。有一句话叫don't do evil,在你的认知范围之内,不要作恶。当然有时候就像奥本海默一样,他最初的目的也不是为了作恶。所以产生恶果有时候不一定由你控制。但要尽全力确保这个事情在人的意愿里。在做事情过程当中,将一切后果考虑周全。


文中配图部分来源于视觉中国,部分来源于网络



-END-



编辑 | 向由

排版 | 八斤



2024年南风窗杂志全年订阅

扫描二维码即可直接订阅



南风窗原创访谈节目

 《致敬实干家》 

人生如远征,致敬实干家。



南风窗新媒体 出品

未经授权 禁止转载

欢迎分享至 朋友圈


投稿、投简历:[email protected]

广告、商务合作:

 nfcnewmedia


扫描二维码 即刻秒杀



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
"妈妈让我来自首",7岁男孩在派出所写下"bǎozhèng书"A-Level心理学不简单,相关大学专业的申请也很难。德堡路、奥纳路、华京路……这些路名不简单!被员工抵制的OpenAI新任CEO,曾称在微软工作是出卖灵魂给动物“拍照片”,一点也不简单~李佳琦人设崩塌的真相,并不简单...一碗牛肉面的试验科学这群达拉斯大妈,疯狂爱上来自中国的它!天天组团白石湖深圳的这群程序员,很不简单最好的7B模型易主,笔记本轻松跑,免费开源可商用,来自“欧洲的OpenAI”歪屁股天后不简单?​口红一哥立场不正?​海绵宝宝状态好?当三女卖惨?甜姐不爱炒CP?章子怡这人不简单!简单菜“不简单”:超7万家预制菜企业如何竞逐红海九月初四大名香独占其三,这款小众香不简单OpenAI终于Open一回:DALL-E 3论文公布、上线ChatGPT,作者一半是华人被微软“养大”的OpenAI,决定反噬微软?全民反間谍,草木皆兵.专访丨积家CEO Catherine Rénier:情感联结和艺术表达对腕表也至关重要哪个少年不多情哪个少女不怀春--美女归来成都翘臀语文老师吸引无数少女?这个男人不简单!合二为一,这种糕点不简单再爆大料!果然,章子怡这人不简单!!!一农民娶了一个懒老婆,她不做饭,也不同房,10年后,老农发现,老婆的身份不简单棒子国政坛 “地震”三连发,不简单!如何设计一个安全好用的OpenApi中国这个省会,真的不简单!38岁的OpenAI创始人兼CEO被开除!宫斗背后谁最心急?日式蒲烧茄子 - Kabayaki Eggplant。最好的料汁配方,分分钟做出味香色美,软糯香甜的佳肴。风投争购不上市的OpenAI员工股,估值高达900亿美元有本事嫁豪门,还有本事过得爽,这个女星手段不简单闯关、逆袭、斜杠、跨越阶层,这个女子不简单年入13亿美元的OpenAI低调换价值观!但比AGI更重要的是什么?被微软“养大”的OpenAI,决定反噬微软中国会有自己的OpenAI吗?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。