回应关于文心一言的几个质疑,李厂长还给AI创业者提了几点小建议。采访|冯大刚
撰文|邓咏仪
编辑|杨轩 苏建勋
封面来源|视觉中国
2023年,全世界的关注焦点,都在AI大模型的焦灼竞赛。中国参赛选手、百度“文心一言”在研发阶段时,百度技术团队曾与ChatGPT进行对比测试,李彦宏对36氪回忆,当时“差距是40分的水平,一个月能追得上。”可过了一个月,技术团队再次测试后,发现差距反而拉大了——AI大模型的发展速度不是线性的。紧张追赶之后,到文心一言今年3月16日发布时,甚至“能达到它(ChatGPT)今年1月份的水平。”李彦宏对36氪说。要说文心一言和ChatGPT差距多大?“可能最多是两个月。但这两个月什么时候能追上,才是更重要的问题。”过去一周,AI领域处于更强烈的疾风骤雨之中。百度文心一言发布会前一天,OpenAI发布了新一代GPT-4大模型;后一天,又有微软发布搭载最新GPT-4的AI助手Copilot——均是震撼业界的产品进展。百度文心一言随之成为激烈争论的对象。带着人们围绕文心一言的诸多质疑,36氪独家访问了百度创始人兼CEO李彦宏,直接发问:为什么发布会用了Demo而不是实时演示?为什么产品在不甚完美时就发布?这些质疑折射出国人的复杂情绪:人有我无的焦虑,民族情绪的高涨、期待与失望间的起伏……在回应质疑之外,36氪在与李彦宏交谈中,印象更加深刻的,是他给出了关于AI行业的许多直接论断。比如,被问到中国创业公司里会不会再出一个OpenAI?他直接回答“基本不会了”,“没有必要再重新发明一遍轮子。”比如,“在应用层,将会出现全新的、十倍于现在微信和抖音的创业机遇。”比如“AI将会颠覆云计算市场”。比如,AI虽然会取代人类工作,但有更多意想之外的机会。一个针对个人的提示是,不会面向AI写提示词(prompt,人与机器进行交互的指令语言)的人会被淘汰。无论如何,我们正站在一个历史性的时点:基于AI大模型技术,可能开启一个新增长时代。就在两天前,英伟达发布了专用于大模型计算的新GPU,能让大模型处理成本下降一个数量级。“我们正处于AI的iPhone时刻。”英伟达创始人黄仁勋在会上三次激动地强调。暂时忘却历史臧否,而是把百度视作一家在AI领域深耕十余年、花费千亿的公司,李彦宏的声音此时格外有时代意义。以下为对话全文,经36氪编辑整理:
36氪:3月16日文心一言发布会之后,网上有非常多的声音,其中有祝福,也有质疑,今天我是代表质疑的声音。首先问一个小问题,今天这样一个突然的采访,会不会让你觉得有压力?李彦宏:不会。确实像你讲的,3月16日之后,网上有各种各样的声音,我自己也确实有一些话想说。李彦宏:我真没觉得自己紧张。因为这个东西(指文心一言)是我非常熟悉的,包括那5个演示场景,基本上都是我选的,或者至少是别人给我建议、我认真看过的。后来我也回看了发布会实况,也没觉得我在任何时候紧张。我猜测,是因为当时在台上,我看不到股价变化,所以没有被它所影响。但是很多在台下的人,包括看直播的人,能够看到一些资本市场的反应,又看不到我们真实产品是什么样子(因为当时还没有发布出来),所以会有此猜测。36氪:在发布会中,你提到产品还没有准备好。为什么要在还没有完美的情况下发布?李彦宏:最主要的原因,是因为有市场需求。我们有好多客户都在问,这个东西什么时候出来?我们什么时候能够用?你能不能保证我是第一批试用产品的人?不断有人在问这方面的问题。目前整个大环境,是ChatGPT非常火,甚至被神话了。大家一定是有焦虑感的,如果我们的客户不能及早地用最先进的产品,他们也会有焦虑感。在这种情况下,我们确实希望尽早把它推出来。从技术发展的规律来讲,这一类型的产品,确实需要有人类反馈之后,它的演进与能力提升才会更快。我们也希望它更快提升,所以必须要及早推出来。36氪:选择在3月16日开发布会,这个日期是怎么确定的?李彦宏:一开始我们想的是3月底,其实哪一天我觉得都是可以的。但我在很早的时候,答应了去参加今年的亚布力论坛,亚布力是3月17日,那时我会见到很多新老朋友,包括政府领导、媒体,大家一定会问(文心一言),那个时候我们还没有发布的话,别人问起来,我真不知道该说什么了——你说得少,大家会觉得你一点信息都不透露,你不拿我当朋友;说得多,我们是上市公司,等于选择性地披露一些东西,也是不行的。所以想来想去,决定稍微往前赶一点。为了适应3月17日亚布力论坛,就决定3月16日来开发布会。36氪:所以碰上OpenAI发布新版本,这是偶然。李彦宏:对,我们事先并不知道OpenAI会在那一天发GPT-4。对于我们来说实际上也没有那么重要。我们自己能看到的可提升的地方已经足够多了,先把这些东西做好就够了。36氪:发布会现场为什么会用先做好的Demo,而不是实时展示?李彦宏:我是希望能现场演示的,因为人机对话产品具有极强交互属性,但后来两个因素让我改变了主意。一是生成式AI每次给出的答案不一定一样,会带来不确定性。二是真正说服我的理由,是全球所有类似发布会,没有一个是现场演示的,都是录好的。如果大家都可以,那我们也OK。36氪:文心一言发布的产品有五个场景,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,为什么是这样的五个场景?李彦宏:这是很好的问题。我们选择的逻辑是这样:文心一言对标ChatGPT,所以大部分ChatGPT有的功能,我们也要有。但同时,我们毕竟植根于中国,所以,我们的对话型产品,一定要体现我们对于中文、对中国文化更好的理解。我们确实有一些ChatGPT没有的东西,希望在发布会展示给大家。所以,前三个场景是对标ChatGPT已有的功能,我希望大家能够感受到我们的东西不差。比如第一个例子是,三体的作者是哪里人?我在ChatGPT里面试过很多次,它答的都是错的,每次生成的答案都不一样,有时候说甘肃天水人,有时候说山西吕梁人,答案非常随机。所以,我第一个例子用了那个例子,但是前三个例子的那些能力,大家已经看过了,在ChatGPT里面那些能力都是有的。到第四个例子,文心一言对于中文的理解,或者对于中国文化的理解,确实是更加到位一些。我们综合了一些知识增强,检索增强等能力,对“洛阳纸有多贵”“刘慈欣的籍贯”这类事实性问题,文心一言能够理解,并且作出正确的回答,准确率更高一些。第五个例子,是多模态能力的展示。有一个四川话,有一个文生图,一个文生视频,这代表了百度过去十几年在AI上综合能力的积累。做这五个例子的时候,我给团队提了个要求,我希望产品发出去之后,能让大家玩起来。第一个就是刚才讲的四川话,我们有语音合成的能力,也对中国情况更了解。所以,我希望当用户提问的时候,不管是提什么问题,我们都能够用语音合成,并且能支持用各种各样的方言说出来,不管是四川话还是广东话。我希望大家觉得很有意思,喜欢去玩这些东西。第二个要求,当用户的问题本身存在事实性错误时,我们能够辨别,比如“二战期间苏联为什么轰炸波兰?”其实苏联没有轰炸波兰,是德国轰炸波兰。我希望文心一言能够辨别用户问题当中是有错误的,并且告诉你说,你刚才说的不对,我告诉你正确答案是什么。所以当用户有这样的问题,或者故意进行错误引导的时候,如果产品能够辨别,用户会觉得你很聪明。李彦宏:能够给大家多带来一些欢乐的话,何乐而不为?36氪:提及ChatGPT,别人一定会把它跟文心一言对比,你觉得哪个更领先?假如ChatGPT更领先的话,你觉得它领先文心一言几年?李彦宏:这个问题应该这样说,ChatGPT发布是去年11月30日,我们现在已经发布了,也就是说不可能被领先几年。但是科学地去评比,文心一言到底是处于去年ChatGPT 11月30日的水平,还是12月30日的水平?这个我们没有特别严谨的方法评测,我们自己可以保留(产品状态),但是ChatGPT当时的状况我们已经保留不了了。但是我可以给你讲一个我们内部开发的过程。第一版产品出来的时候,我们和当时的ChatGPT做了一个对比,和它大概差40分。李彦宏:我们的对话式人工智能大语言模型应该具备的各种各样的能力,每一项能力去挑了提示词(prompt)。李彦宏:对。当时我们能看到的提升空间远不止40分,所以我们觉得说一个月之内肯定追上它。但是过了一个月,我们又做了一次评测,发现这个差距不仅没有缩小,而且拉大了。所以我们当时很紧张,说这个东西越做,跟人家差得越远了,但后来发现,其实ChatGPT那种升级不是匀速的升级,虽然提升很快,但是它有自己的发展规律。而百度这种一版一版的迭代方式,升级速度是非常非常快的。等到我们敢说3月16日开发布会的时候,我们觉得就是至少可以达到它去年11月30日的水平,甚至说按照理性判断的话,应该达到了ChatGPT今年1月份的水平。所以,那个时候我们才敢出去发的。尤其当你去测试ChatGPT比较擅长的能力(英文、编程等),会发现差距很大,那是因为ChatGPT也发生了很大的变化。我们发布会前一天,OpenAI上了GPT-4,和GPT-3.5也是不一样的。所以你要说我们和ChatGPT差距多大?我觉得可能最多是两个月,但是这两个月什么时候能追上,才是更重要的问题。36氪:可以说,文心一言在两个月后能达到ChatGPT的水平吗?李彦宏:远远不够,因为人家也在进步。百度进步的速度要比它快,有一天不仅要追上它,还要超过它。刚才我们讲的文生图能力,百度的能力打磨比较久,大家玩起来挺嗨。GPT4本身没有文生图能力,站在另一个角度比较的话,ChatGPT落后百度,文心一言早就有这个能力了。早在文心一言发布之前,大家用文心一格(指代百度基于文心大模型的文生图系统)就能体验这个能力,这是我们做得好的地方。ChatGPT发布的时候,大家都说它跨时代、震撼发布等,它发布的理解图片能力,不是文生图,只是输入图片告诉你这个图片是什么。客观比较下,我们有我们的长处,我们也很有信心在综合能力上,能够迅速追上甚至超过。刚才我们讲的文生图的能力,百度的能力打磨比较久的时间,我们目前就是大家玩起来挺嗨,但是ChatGPT本身没有文生图的能力,站在另一个角度比较的话,ChatGPT落后百度,文心一言早就有这个能力了。ChatGPT4发布的时候,大家都说它跨时代震撼发布之类的。其实它发布的所谓理解图片的能力,不是文生图,输入图片告诉你这个图片是什么。我们搜的只是官网上的能力,没有人体验过。36氪:相比ChatGP的调用成本,百度的成本是更高还是更低?大概是多少?李彦宏:成本比较类似。但是这个东西不重要,重要是我们可以通过端到端的优化,让这个成本迅速下降。36氪:比如使用的时候,价格会是ChatGPT的百分之多少?36氪:现在百度已经为文心一言投入了多少,还会继续投入多少?李彦宏:这很难划分清楚。例如,我们对于大语言模型的投入算不算在内?可能有些投入是去做了辨别式的东西,比如去优化搜索等等,有些是生成式的。如果单讲生成式AI可能是十亿、几十亿,未来投入会更大。如果是整个这四层(指应用层、模型层、框架层、芯片层),因为需要四层端到端的优化,大语言模型才能够有竞争力,芯片、框架、等等这些都加起来的话,十年投了上千亿元。如果没有那些投入,根本就不可能出现文心一言这个模型。
36氪:我看到你自己发的百家号视频,说百度是在全球大厂中第一个发布类ChatGPT产品的,领先于微软,因为微软调用的是OpenAI的接口,Meta、Google没有发布真正同类型的产品,为什么这么说?李彦宏:人工智能如果按语言模型来分类,一种叫辨别式AI,典型应用是搜索。搜索就是根据你提的需求,看一个个网页跟你的需求匹配不匹配,主要是在辨别;另一种是ChatGPT,也就是生成式AI产品,你提一个提示词,它根据提示词发挥,甚至发挥错了都有可能,这个方向早期并不被大厂看好,积累也没有特别深厚。相比下来,百度在语言模型方面,积累还是不错的,我们在AI上连续十几年投入,第一版的语言模型,文心大模型2019年就发布了。过去一年半时间,我们一直很看好生成式AI,有不错的投入。所以当发现这有大机会的时候,我们迅速增加资源,把它做出来。在这过程中,其他大厂像Google、亚马逊、Facebook,你说它们重视不重视?现在肯定很重视。想不想做出这么一个东西来?肯定很想。听到这就很容易理解,为什么我会说百度是大厂当中第一个做出来的。36氪:很多人都在准备做类似OpenAI的创业,比如李开复、王小川、王慧文,你对他们有什么建议?李彦宏:很多人也在问我,中国会不会再出一个OpenAI?基本不会了。OpenAI诞生是因为美国大厂都不看好这个方向,但现在中国的大厂都看好AI大模型,都在做这个方向。创业公司重新做一个ChatGPT其实没有多大意义。我觉得建议有两点。第一,创业公司的特点是方向可以不停改变,船小好调头,在市场状况发生变化时迅速调整战略,公司成立时想做的事和后来做的事可以不完全匹配。第二,我觉得基于这种大语言模型开发应用机会很大,没有必要再重新发明一遍轮子,有了轮子之后,做汽车、飞机,价值可能比轮子大多了。36氪:现在大家都在担心大模型的算力的问题,包括芯片,百度会怎么解决算力问题?李彦宏:其实算力是很笼统的说法,你的CPU怎么样、GPU怎么样,芯片跟框架匹配程度怎么样,框架跟模型的匹配程度,里面可提升的空间都是很大的。百度在四层架构都有领先的产品。芯片本身不管是摩尔定律,或者GPU的发展速度也非常快,框架也不能叫成熟,我们的工程师还在日以继夜优化框架。模型更新得就更快了,一天能够上线三次升级,这种速度一定会使效率越来越高。将来制约整个大语言模型发展的很可能不是算力。今天我们看到算力很紧张,将来你可能发现算法突然变了,不是这个算法了,(制约发展的)可能就是另外一套东西。36氪:在整个生态圈,芯片层、框架层、模型层、应用层,你觉得最大的创业机会在哪?李彦宏:在应用层。回看移动互联网时代,今天特别成功的微信、抖音、淘宝,都是应用。操作系统其实没几个,一个IOS,一个安卓,仅此而已。很难讲安卓的价值比微信、抖音大。在应用这个层面,机会很多,能够创造的价值也非常大。36氪:因为在搜索上市占率较低,微软可以热衷于做这件事,但百度做生成式搜索引擎会颠覆自己的商业模式。你怎么看待这个观点?李彦宏:我确实听到了这种说法,但我觉得离我们真实的想法差得太远了。首先我觉得不会颠覆,你用的其实还是百度搜索。当这个能力(文心一言)被赋予到百度搜索上的时候,几乎不会改变你的使用方法。你不需要重新再花很多精力去学百度搜索怎么用,只是答案更精准了,过去篇幅比较小的答案,现在可以更加详实、更加生动、更加活泼,它扩大了搜索的边界。我们并不是整个移动互联网,只是整个移动互联网的很小一部分。干的事变多之后,会有越来越多的用户从别的APP转到百度。从这个角度来讲,我无论如何都希望百度APP被文心一言所赋能,它能够颠覆现在的百度搜索,我无比渴望发生这样的事情。但是,这只是整个故事的极小一部分,更大的故事其实是在云计算。因为刚才也讲到四层架构,就是芯片层发生了变化,从CPU到GPU,在框架层也发生变化。框架层我多讲两句。百度在全球大厂当中最先做出来是有道理的,我们在芯片层、框架层、模型层、应用层都有自己的布局,全球大厂在这四层上都有领先产品的是没有的。看这四层架构的话,我们在每一层都可以说是提早了很多年来布局,当你这些能力都很完整的时候,未来人们再去开发应用,基于百度智能云是最方便的。这个机会要远远大于一个百度搜索颠覆自己的机会,我真正兴奋的、包括我3月16日发布会上主要讲的都是这个机会。36氪:可今天我去搜索百度的东西,当中有15个搜索结果,其中有两三个是广告,简单说这是百度的商业模式。未来如果文心一言只给出一个答案,这怎么商业化?李彦宏:这个商业化的可能性有很多。今天如果看ChatGPT的话,它的做法实际是付费使用,买一个会员,一个月多少钱,它靠订阅来养活自己,就不需要广告。我从来没有觉得商业模式是一个问题。如果我们给大家(不管是个人还是企业)提供了价值,他们就会通过市场机制来回报我们。36氪:你自己提到很多,在美国生态当中,大公司和大公司、大公司和创业公司之间似乎更紧密,在中国是不是不一样?大公司不会用彼此的产品。李彦宏:Google可以索引几乎所有互联网的内容,但是中国的话每一个APP都有自己的这种独立的生态,也有一定的壁垒。所以用户在获得信息上确实没有那么方便,。36氪:美国五大互联网巨头(FANNG),似乎是一个联盟。中国好像不是这样。李彦宏:联盟也说不上,我觉得美国人的这个思维方式也竞争,比如微软和Google就是竞争。但是它的思维方式是说,如果你已经很领先了,我最好别做一个跟你一样的东西,我如果通过创新做一个跟你不一样的东西来竞争,那才是我的本事。在中国,大家的思维方式更像是这条路你跑通了,我也跑同样的路,咱看看谁跑的快。36氪:文心一言会接入哪些产品,以及对百度的业务矩阵有哪些机会和变化?李彦宏:这些天我们各个部门也都在开会讨论,文心一言是一个通用能力,它跟各个产品的结合都是很自然的,跟搜索、贴吧、文库、百度健康、小度等等。几乎公司里面每个产品拿出来,包括百度书法,都能自然地想到和它怎么结合,让产品变得用户体验更好,更加powerful。李彦宏:是的。
云计算是Game Changer,应用层有十倍机会36氪:你在财报会上提到,文心一言会是改变云计算的Game Changer,为什么?李彦宏:过去,云计算主要卖算力,算力就是你的计算速度有多快,存储能力有多少。两三年前人们的理解是,基于一个AI开发框架去开发应用就好了。今天就会看到,我们完全没有必要基于芯片层、框架层来开发应用——基于大模型就好了,又快,成本又低。那么以后当人们在购买云计算服务的时候,他会看你的模型好不好,而不是你底层的算力怎么样,存储怎么样,所以,AI大模型会颠覆整个云计算市场。我认为微软其实也是这样想的。大家都知道,ChatGPT和微软的产品真正结合,是非常厉害的。这是很多云厂商非常害怕的事情。36氪:百度云会不会因为文心一言的使用,会成为中国领先的云供应商?李彦宏:我对此充满信心,一旦大家明白过来,你以后选择云服务的时候应该看什么,或者其实也不需要它自己去琢磨。你有你的需求,你有你的客户需要去维护,什么样的方式能够让你更好地维护你的客户,收入更多,利润率更高,那他一定会从这些角度推演到:用百度的智能云是更好的选择。36氪:未来十年内,会不会出现诞生新的微信,新的抖音?李彦宏:肯定的。不仅仅是诞生这些,我觉得诞生10倍于这些app价值的机会,完全是存在的。36氪:今天无数人在提问:AI会不会让打工人没有工作?OpenAI的创始人Sam Altman说,大量的人一定会失业,所以OpenAI会按需收费,给没有工作的人补贴。这其实是有点悲凉的,他自己说也有点可怕,你觉得这个事情会发生吗?这个问题你怎么看。李彦宏:今天没有马车夫这样的工作,因为出现了汽车。但是今天世界上存在的工作机会跟100年前相比,不仅是多了,而且多了很多倍。我没有那么悲观,我是乐观的。不管有多少工作被替代,这只是整个图景的一部分,另外一部分是,存在我们现在甚至无法想象的更多新机会。我做一个大胆预测,十年以后,全世界有50%工作会是提示词工程(prompt engineering),不会写提示词(prompt)的人会被淘汰。李彦宏:我不想去预测那个时候百度收入是多少,员工数是多少,这些对我来说没有那么重要。百度的使命就是用科技让复杂的世界更简单,这个事情现在成立,十年之后还会成立。我希望十年之后回望今天,会发现每一个普通人的生活、整个社会会被百度改变。我们起了什么正面作用?我们有什么东西没有做到位?我们什么东西可以做得更好?我更希望琢磨这样的事情。36氪:有个词叫“智慧涌现”(Emergent Intelligence)。我个人持有这样的观点:人没有什么特殊的,不管是引以为傲的创意也好,感情也好,像一个个计算单元,计算单元多了,就会产生出情感、创意。你觉得会是这样吗?李彦宏:我觉得不会是这样,我恰恰觉得人是唯一。在如此浩瀚的宇宙,目前没有任何迹象证明有外星人,足见在这个宇宙当中人有多么的独特。今天我们说想用机器替代人,想复刻一个人,我认为这是不现实的。我觉得完全没有必要复刻人,机器有很多事干的比人好太多了,没必要去跟机器比。应该充分发挥它擅长的地方,我们甚至没有必要让它发展出来情感这类东西,即使发展出来了,可能也是另外一种东西,和我们(人类)的情感还是不一样的。36氪:十年后,AGI(通用人工智能)是不是已经实现了?李彦宏:这是一个开放性的问题,我没有答案。如果非要让我去做一个二选一的话,我认为(十年后通用人工智能)没有实现。“强人工智能”(Artificial General Intelligence),意思是它和人的能力是一样的。这个词对应的是“弱人工智能”和“超人工智能”。这种划分方法我不是很认可。我认为机器比人强的地方有很多,比人弱的地方也有很多。我们完全没有必要把自己框在“一定要让机器和人一样”里面,我认为这个方向就是不对的。智能涌现也好,机器越来越聪明也好,我都很看好,我唯一不觉得我们的努力方向是要把机器变成人,完全没有必要。36氪:对于未来十年,你觉得确定无疑的一个未来是什么?李彦宏:技术进步的速度越来越快,生产效率提升会越来越明显,这是过去很多年的发展之中不断证明的。如果过去大家可能一周工作5天,也许10年之后工作3天就足够了。劳动生产率的提升会让人们生活的幸福感更强。我自己也因为这件事情很兴奋,因为我能够参与其中并且贡献一些东西。36氪:这是一个趋势。如果作为结果,什么样的结果是确定无疑的?十年以后人类压力更大还是更幸福?36氪旗下官方公众号
👇🏻 真诚推荐你关注 👇🏻