中国已经有238个大模型了？李彦宏劝各位少做点大模型多搞搞应用吧

科技

2023-11-16 04:11

大模型太多了

中国有多少大模型？

238个。

那中国创业者的AI原生应用有哪些？

似乎没有几个大家耳熟能详的。

李彦宏认为，这是个问题。

“中国的大模型很多，但是基于大模型开发出来的AI原生应用却非常少。”百度创始人李彦宏11月15日在西丽湖论坛上说。

根据一些公开资料，截止10月份国内已经发布了238个大模型，而6月份的时候这个数字是79个，4个月就翻了3倍。另一组数据显示，截至 2023 年 10 月， Hugging Face 上已经有接近 3 万个文本生成模型可供下载。

但是我们真的需要这么多模型么？这个话题已经开始被业内反复讨论。尤其当越来越多的模型以刷榜的形式亮相，但后来听不到什么后续进展，并且在模型的技术路线上看不到什么新的变化和尝试的时候，这么多的模型，某种程度正变成对算力的浪费。

李彦宏说的非常直接：

“我见到很多企业，CEO把这个任务交给IT负责人，IT负责人和工程师天天被那些所谓的“震撼发布”、“史诗级的更新”、“iPhone时刻”、“炸裂”这些说法所忽悠，都想去自己搞个基础模型，或者按照网上传播的评测方法来挑选一款评分高的大模型，大家就以为这就是拥抱AI时代了，殊不知大模型本身不仅不产生任何价值，还造成了对公司资源和社会资源的巨大浪费。”

他所描述的这种焦虑之下的慌张，其实很多从业者都会感到心有戚戚。对于AI的落地来说，模型提供的是最底层的能力，尤其是以参数大和训练数据丰富为特点的大语言模型，它带来的智能涌现是这一轮AI彻底成为一场技术革命的根本原因。然而，无论从今天如此众多的模型的表现来看，还是从长远的本质逻辑来看，似乎我们对于训练模型这件事投入的都有些太多了，而且很多时候做这些投入的时候并没有想清楚到底在做什么。

首先是基础模型和专业模型的区别，很多人在混为一谈的讲。李彦宏指出，其实很多的所谓大模型并非通用模型而是许多垂直模型，或者叫专业模型。但他认为这样的专业模型是没有智能涌现能力的。

“只有当你的模型的参数规模足够大，训练数据量足够多并且能够不断投入，进行迭代，才能够产生智能涌现，大模型才能具有触类旁通的能力。”

做个简单类比，拿医疗行业来说，一个专业的医疗领域模型可以帮助医生做很好的医疗知识的检索和相关内容的生成，但一个包括了医疗数据在内，同时拥有更多人类各领域知识的通用大模型，才有可能帮助医生从他们不曾思考过的视角，不曾联系在一起的数据和知识的角度带来全新的判断。这两类模型的意义会完全不同，后者才是这一次AI浪潮与以往不同之处。

李彦宏认为，在这样的不同模型的能力和定位之下，大模型的产业化模式应该是把基础模型的通用能力和行业领域的专业知识相结合。小模型长在大模型之上，大模型的通用智能来兜底，小模型则可以更快的做出反应。

而用更加长远的思路来看，大模型本身其实会最终变成一个基础底座，它就类似操作系统，那么最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。

“以PC时代为例，各种软件都基于一个Windows系统开发；移动时代，操作系统也只有安卓和iOS两家。大模型是AI时代的各类原生应用的基础底座，类似操作系统，那么最终注定只有少数才能成为开发者依赖的大模型。”李彦宏说。

“所以，不断地重复开发基础大模型是对社会资源的极大浪费。”

等待杀手级AI应用

那什么样的大模型能够成为这新时代的Windows，安卓和iOS呢，李彦宏认为，它需要能驱动AI原生应用爆发。所谓AI原生应用就是基于大模型智能涌现后产生的理解、生成、逻辑和记忆能力而开发出来的应用。在大模型的能力出现前，这些应用没有办法实现。

“第一，能用自然语言交互，这是最根本的变化；第二，能充分利用理解、生成、推理、记忆等，这些过去不具备的技术能力；第三，每个应用的交互都不超过两级菜单。”李彦宏此前曾将AI原生归纳为三个特点。

李彦宏在此前多次演讲中都曾提到，模型本身并不直接产生价值，基于基础大模型开发出来的AI原生应用才是模型存在的意义。而这也在成为越来越多从业者的共识——那些层出不穷的模型，和层出不穷的论文，事实上并没有把模型的价值展现给普通人，只有应用才能架起这个理论上的又一场工业革命和亟需新技术来解决各种问题的现实世界的桥梁。

所以，在今天的大模型浪潮里，相比于层出不穷的大模型和研究，其实更需要出现更多的AI原生应用。

在美国的AI创业浪潮里，事实上这种AI原生应用已经开始涌现，无论是基础设施层的Langchain，还是AI虚拟对话的Character.ai，甚至包括Humane推出的硬件AI Pin都在某种程度上属于对AI原生应用形态的探索。

“如果我们看国外，除了有几十个基础大模型之外，实际上，已经有了上千个AI原生应用，这是在中国市场上没有的。”李彦宏在当天的演讲中说。

所幸这种差异还远远没有到决出胜负的时刻。因为直到今天，最好的AI原生应用还没出现。李彦宏认为，移动时代有它自己的“mobile-native”应用，它们彻底改造了人类的生活，同样AI原生时代也会诞生基于大模型的新兴国民级应用。

“人类进入AI时代的标志，不是产生很多的大模型，而是产生很多的AI原生应用。”李彦宏说。

文心一言显然希望成为能够诞生杀手级应用的那个底座。按照这个方向，百度上线了大模型插件平台、帮助企业在百度智能云千帆大模型平台上开发自己的AI原生应用，同时百度自己也对核心的产品进行改造，搜索开始提供多模态的答案，文库开始帮助用户生成内容，转化成生产力工具，智能代码助手也已经在百度内部的真实生产环境里发挥作用。

李彦宏也公布了自从8月31号开放以来文心大模型的API调用量，他表示，调用在指数级增长，文心大模型一家的调用量比其他200多家大模型的调用量加起来还要多，而百度目前也已经拥有了超过800万AI开发者。

有了人气，一切才有可能；有了应用，技术才能被更多人感知到它的能量和价值。相比于大模型的数量，和这些大模型天天刷出的榜单数据，这800万开发者，和那指数级增长的调用量，才是大模型行业亟需看到的指向繁荣的标志。

以下为李彦宏当天演讲实录全文：

点击关注，精彩不错过↓

点个“在看”，再走吧👀

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章