“没有应用的大模型一文不值”!李彦宏最新演讲全文
2024.07.05
本文字数:4532,阅读时长大约7.5分钟
导读:商业化的闭源模型是最能打的。
作者 | 第一财经 刘佳
百度董事长兼CEO李彦宏还记得自己第一次来参加世界人工智能大会(WAIC)是在2022年,那一次大会的主题和元宇宙相关,主办方传话给他,希望他讲一讲元宇宙。他回:“我还是讲AI吧,我讲不了元宇宙”。当时,他在演讲中提到自己对AI走势的判断:AI的技术发展路线发生了方向性改变,从过去的辨别式人工智能转向了未来生成式人工智能。
上述预判发生在2022年的夏天,5个月之后 ,GhatGPT发布,紧接着人工智能的又一波浪潮以前所未有的速度席卷全球。
“两年的时间恍若隔世,整个世界都变了,人工智能可以说颠覆了绝大多数人的认知。”李彦宏在今日的WAIC演讲中感慨。
2023年国内出现百模大战,在李彦宏看来这造成社会资源的巨大浪费尤其是算力浪费,但是也使得我们追赶世界上最先进的技术模型能力得到建立。
他说,去年10月百度宣布文心4.0发布的时候,提到文心4.0毫不逊色GhatGPT,大家不以为然,但现在国内很多闭源模型声称已经追平超越了GhatGPT。
他还指出一些外行混淆了模型开源和代码开源两个概念。“模型开源拿到一大堆参数,还是要做安全对齐,你不知道这些参数怎么来的,无法做到众人拾柴火焰高。即便拿到对应源代码也不知道用了多少数据,用了多少比例数据训练这些参数。所以拿到这些东西,并不能够让你站在巨人肩膀上去迭代和开发。”
7月4日的演讲中,他再次谈到大模型领域开源与闭源的路线之争。他认为,在同样参数规模之下,闭源模型能力比开源模型要更好。而如果开源想要能力追平闭源,那就需要有更大的参数,这就意味着推理成本会更高,反应速度会更慢。
“很多人拿开源模型来改款,以为这样更好服务个性化应用。殊不知这样创作的孤本模型无法在基本模型获益,也没有办法跟别人共享算力。”李彦宏说。
与此同时,他也承认开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。“当你处在一个激烈竞争市场环境当中的时候,你需要让自己业务的效率比你的同行更高,成本比你的同行更低。这个时候商业化的闭源模型是最能打的。”
比起开源闭源路线,他认为更重要的还是应用的落地。他提到,现在业界的关注点都放在了基础模型身上,“一天到晚到处跑分刷榜,谁又超越GhatGPT4,OpenAI又出来Sora……”但事实上,没有应用,光有一个基础模型,不管是开源还是闭源都一文不值。
他呼吁行业不要卷模型了,要去卷应用。应用其实离大家并不遥远,基于基准模型应用在各行各业已经开始逐步渗透。他援引文心一言的调用量数据,两个月前还在2亿,现在已经到了5亿,说明大模型背后代表了真实的需求,有人真的从大模型当中获益了 。
他举个例子,在快递领域,让大模型帮助处理订单,做到了一张纸一句话寄快递而不再需要其他繁琐流程,时间从3分钟缩短19秒,而且90%以上的问题都是由大模型解决,效率提升非常明显。在小说创作领域,网文作者有了AI的助力“如虎添翼”。而类似于代码生成的软件,在各个领域也在逐步渗透。李彦宏透露,百度内部有30%左右的代码已经是用AI生成的,代码采用率超过44%。
因此,李彦宏提出业界要避免掉入“超级应用陷阱”,认为一定要出现一个10亿DAU的APP才叫成功,这是移动时代的思维逻辑。AI时代,规律可能不是这样的,“超级能干”的应用比只看DAU的“超级应用”更重要,只要对产业、对应用场景能产生大的增益,整体价值就比移动互联网要大多了。
智能体是他最看好的AI发展方向。他判断,未来在医疗、金融、教育、制造、交通、农业等等领域都会依照自己场景,自己特有经验规则数据等等做出各种各样智能体,将来有百万量级的智能体出现,形成庞大的生态。
AI正在以前所未有的速度向各行各业渗透。很多人担心,人类是不是就没有工作机会了?李彦宏说自己听到的抱怨很多,建设性意见很少,很少有人去致力于发掘生成式AI带来的新的工作机会。
他说,已经看到有一些全新的工作冒出来,比如提示词工程师。这个职业未来不用编程,但需要用很强的逻辑性把工作流说清楚,要用提示词对模型进行调教,随着智能体大量涌现,这种工作需求也会飙升。“这些工作机会通常门槛并不高,你做得一般也能够养家糊口,做得好的上限可以年薪百万。”
以下为演讲全文:
各位下午好,非常高兴再次来到上海参加世界人工智能大会,我是这个会议的常客了。去年因为出国没有来。所以我上一次来参加WAIC是2022年,我记得那年大会的主题是元宇宙,主办方也跟我讲,希望我讲一讲元宇宙,我说我还是讲AI吧,我讲不了元宇宙,所以我当时讲的主题是AIGC,就是AI Generated Content (Artificial Intelligence Generated Content)。
我认为AI的技术发展路线,发生了方向性的改变,就是从过去的辨别式人工智能,转向了未来的生成式人工智能。
讲这个话是在2022年的夏天,5个月之后,大家都知道,ChatGPT发布了,而后来的事情大家就更清楚,所以两年的时间,恍若隔世,感觉整个世界都变了,人工智能可以说颠覆了绝大多数人的认知。
2023年国内出现了百模大战,造成了社会资源的巨大浪费,尤其是算力的浪费。但是也使得我们追赶世界上最先进的基础模型的能力得到了建立。
去年10月,我宣布文心4.0发布的时候说,文心4.0的能力跟GPT4相比毫不逊色,好多的同行还不以为然,今天大家可以看到,国内已经有多款闭源模型声称它们已经追平或者是超越了GPT4的水平。
注意,我们说的是闭源大模型,不是开源大模型,这也是今年以来争议比较多的一个话题。有些外行甚至混淆了模型开源和代码开源这两个概念。
所谓模型开源,是拿到的只是一大堆参数,你还是要去做SFT,还是要去做安全对齐,你不知道这些参数是怎么来的,你是无法做到众人拾柴火焰高的。即使你拿到对应的源代码,你也不知道他用了多少数据,用了什么比例的数据去训练这些参数。所以拿到这些东西,并不能够让你站在巨人的肩膀上去迭代和开发。
所以,同样参数规模之下,闭源模型的能力就比开源模型要更好,而如果开源要想能力追平闭源,那么它就需要有更大的参数,这就意味着推理成本会更高,反应速度会更慢。
很多人拿开源模型来改款,以为这样可以更好的服务自己的个性化应用,殊不知,这样你就创造了一个孤本模型,既无法从基础模型持续升级当中获益,也没办法跟别人去共享算力。
当然,我也承认开源模型在某些场景下是有自身价值的。比如说一些学术研究,或者在教学领域,大家想要研究大模型的工作机制,形成理论,这个时候可能是有价值的,因为大家也经常听到,我们觉得大模型能力很强,但是不知道为什么能力强,因为背后没有理论来支持它,所以研究这个东西,用开源的我觉得没问题。
但是,大多数的应用场景,开源模型并不合适,当你处在一个激烈竞争的市场环境当中,你需要让自己的业务效率比同行更高,成本更低,这个时候商业化的闭源模型是最能打的。
当然,这些都不是最重要的,没有应用,光有基础模型,不管是开源还是闭源都一文不值。
所以,我从去年下半年开始讲,大家不要卷模型了,要去卷应用。但是我看到很多人仍然把主要的关注点放在基础模型上,一天到晚就是跑分,刷榜,谁谁谁又超越GPT4了,openAI又出来sora了,又出来GPT4o了等等。今天这个震撼发布,明天那个史诗级更新,但是我要问,应用在哪里?谁从中获益了?
应用其实离我们并不遥远,基于基础模型的应用在各行各业、各个领域都已经开始了逐步的渗透,两个多月前,我们宣布文心大模型的日调用量超过了2亿,最近,文心的日均调用量超过了5亿!
仅仅两个多月的时间,调用量发生了这么大的变化,足见它背后代表了真实的需求,是有人在用,是有人真的从大模型当中获益了,得到了价值。
比如在快递领域,让大模型帮助处理订单,做到了“一张图、一句话寄快递”,不再需要其他繁琐的流程,时间从3分多钟缩短到19秒。而且90%以上的售后问题,也都由大模型来解决,效率提升非常的明显。
再比如在小说创作领域,一开始也用开源模型做出过一些效果,后来改用文心轻量级模型,经过10轮上万组数据的SFT和post pretrain,结果有了明显的提升,最近又转到文心4.0版本,仅用了数百条数据,4.0就在情节和逻辑方面展现出了非凡的优势,生成的内容无论是可用率还是优质率都大大超过了轻量级模型,网文作者们如虎添翼!
其实更通用的领域,比如说代码生成,文心快码这样的软件,在各个领域,也在逐步的渗透,在百度内部,我们有30%左右的代码,已经用AI生成的,代码的采用率超过了44%。
不过,我们要避免掉入“超级应用陷阱”,觉得一定要出现一个DAU10亿的APP才叫成功,这是移动时代的思维逻辑。其实不一定,AI时代,“超级能干”的应用比只看DAU的“超级应用”恐怕要更重要,只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。
随着基础模型的日益强大,开发应用也越来越简单了,最简单的就是智能体,这也是我们最看好的AI应用的发展方向。制作一个好的智能体通常并不需要编码,只要用人话把智能体的工作流说清楚,再配上专有的知识库,一般就是一个很有价值的智能体了。这比互联网时代制作一个网页还要简单。
未来在医疗、金融、教育、制造、交通、农业等等领域,都会依据自己的场景,自己特有的经验、规则、数据等等,做出各种各样的智能体。将来会有数以百万量级的智能体出现,形成庞大的智能体生态。
而搜索是智能体分发的最大的入口。刚刚过去的高考季,很多大模型公司热衷于去写高考作文,我用AI写一个作文能得多少分,其实这个使用价值是不大的,人家不会让你带一个大模型去参加高考,但是真正的需求是大量的考生在考完之后要报志愿,要选择学校,选择专业,他们对一所大学,一个专业,会有各种各样的问题,而每一个考生的情况又是不一样的。这时候就是需要有一个智能体来回答每一个考生专有的问题。
在高峰时期,百度的高考智能体每天要回答超过两百万个考生的问题,我们总共只有1000万的考生,在一天当中有这么大比例的人在利用这个智能体。
AI正在以前所未有的速度向各行各业渗透,很多人担心如果我们日常的工作都让AI去做了,人是不是就没有工作机会了,这种担心不是没有道理的,但是过去这段时间,我听到的担心,听到的抱怨很多,听到的建设性的意见比较少,很少有人去致力于发掘生成式AI带来的新工作机会。
我在这算是抛砖引玉吧,我觉得一方面这次浪潮,AI更多是在扮演copilot的角色,是副驾驶,还要人来把关,AI只是辅助人工作,而不是替代人工作,它让人的工作效率更高,质量更好;另一方面,我们也看到有一些全新的工作机会开始冒出来了,比如数据标注师,过去几年我们帮助全国20多个城市落地了数据标注中心,提供了大量新的就业岗位,再比如提示词工程师,以后不用编程了,但是做好一个智能体还需要把工作流说清楚,这里要有很强的逻辑性,要用提示词对模型进行调教,随着智能体的大量涌现,这个工种需求量也会飙升。这些工作机会,通常门槛并不高,你做的一般也能够养家糊口,做得好的话,那上限可以年薪百万。
自人类文明诞生以来,永不停止的创新就是印刻在我们的DNA当中的。从石器时代的手斧,到移动时代的手机,再到AI时代的大模型,人类不断创造各种工具来改善生活,来提高生产力。但是它们永远只是工具,只有在被人类所使用的时候才有价值。我们坚定地相信,AI不是人类的竞争对手,我们构建和应用人工智能技术,是为了满足人的需求,增强人的能力、让人类的生活更美好。
谢谢大家!
微信扫码关注该文公众号作者