周鸿祎：大模型引领“新工业革命”，这波红利至少五到十年

2023-06-16 15:06

6月15日- 6月16日，黑马AIGC产业营1期在北京正式开营。作为创业黑马集团首次专为AIGC产业创业者开办的训练营，“黑马AIGC产业营”整合了黑马多年来积累的产业资源与专业服务能力，聚焦基础概念、商业应用、模式创新、前景趋势、产业融合、数据安全等六大前沿主题，通过产业课程、产业社群、产业游学等不同形式，帮助创业者建立和完善关于AIGC产业协同、数据决策、体验革新三方面的核心认知，并引导中小企业实战升级。

在中国AIGC乃至整个人工智能产业当中，360集团是一个至关重要的存在，其不但居于国内AI实力“第一梯队”，而且是国内最早All In大模型，并向中小企业开放能力的公司之一。6月16日，360集团创始人周鸿祎来到黑马AIGC产业营1期加速现场，以《后GPT时代，大模型发展“以人为本”》为题授课。

周鸿祎表示，人工智能大模型是人类有史以来发明的最伟大的工具，它将成为每个人的助手，解锁我们的很多新能力。他还分享了关于当前整个AIGC产业发展的一些重要观点：“目前百模大战已经进入场景比拼阶段，国产大模型弯道超车的关键是发展多模态，数字人是大模型未来最重要的应用入口，未来的增量市场在企业级应用。”周鸿祎表示。

以下为编辑后的周鸿祎授课内容：

刚才听到有人给我一个新称号——中国AIGC第一人，真的不敢当，远远算不上。真正的大模型时代才刚刚开始，我只不过做了两件事：一是行业里这几年说话的人少了，到底中国为什么要发展大模型，得有人为这个行业发出声音，所以我出来说话多一点。另一方面，我也在学习人工智能，以前我给黑马创业者讲的课是辟邪剑法、葵花宝典，现在我是在练吸星大法。吸星大法的特点就是把别人的思想据为已有，我也希望向黑马创业者学习，像云之声黄伟和智源研究院的专家都来过这里，我也学到了他们的思想。对于大模型，其实现在谁都是只懂一点，听专家讲就像盲人摸象，把他们的观点融汇贯通，就有了自己的观点。

01
大模型是人类最伟大工具

今天时间仓促，其实现在的这个题目我不是很满意。“后GPT时代”的说法并不准确。如果把GPT理解成是ChatGPT，现在正是追赶者、超越者粉墨登场的时代；如果把GPT作为一个通用名词，指生成式通用模型或者大模型，那么这个时代才刚刚开始。

科技要“以人为本”。我也很愿意讨论硅基生物如何战胜碳基生物，但是讨论这个话题，根本不会有答案，只取决于你看的科幻小说有多少。其实人工智能取代人，还是有很长一段距离，不要听了我的讲解，回去就把员工开掉一半。我认为，人工智能的发展是帮助每个人提升工作效率，它是人类有史以来发明的最伟大的工具。

人类统治地球，从来不是靠生理能力，但是人类会发明工具。我们跑得肯定没有豹子快，但是我可以发明汽车；飞得没有老鹰高，但可以发明飞机。只是以往的工具只加强了肉体能力，知识传承一直是碳基生命遗传继承的薄弱环节。如果生一个孩子能把你的才华学识继承了，站在你的肩膀上，就可以取得更大的成就。将来，GPT在这个方面可以帮我们解决问题。所以说大模型是人类有史以来发明的最伟大的工具，把人类历史上的很多知识凝聚在一起，成为每个人的助手，解锁了我们的很多新能力。

02
关于大模型
未来影响的三个认知

对大模型如何认知，可以从三个方面来说。

第一，大模型推动的智能化才是数字化的高峰。我们这代人比较幸运，个人电脑、互联网、智能手机和移动互联网时代，都赶上了，从4G、5G到大数据、云计算、物联网，数字化的高峰就是智能化。当前国家的重要战略就是推动数字化，数字化又可以分成两条线：一是数字产业化，即数字化企业如何发展；还有一个更大的市场是产业数字化或者叫产业互联网，这是很多黑马兄弟的机会。我不一定做互联网，我是传统产业，是制造业的，用牛文文说的重度垂直方法，每个行业都可以用数字化重做一遍，这是巨大的机会，也是未来的蓝海市场。企业上云只是手段，最终的目的是实现智能化，大模型推动的智能化才是数字化的高峰。

第二，大模型代表通用人工智能时代的到来。“AIGC”这个词从一个侧面反应了这个结果，AI可以产生内容，比如文生图、文生视频、文生语音……但它反映的还只是表象，还有一个概念——“通用人工智能”（AGI），更能体现其本质。通用人工智能包含几层意思：首先它和过去的人工弱智不一样。过去的人工智能只能做垂直的事，下围棋的下不了象棋，下象棋的识别不了图片，换一个领域就得换一个模型。但是大语言模型用一套模型算法，解决了很多不同领域的问题。很多人有一个误解，以为大语言模型只是解决自然语言处理的，别的行业用不上，这种观点是错的。其实自然语言处理是人工智能领域皇冠上的明珠，是最难的问题。语言是人类思想的结晶，如果人工智能能理解自然语言，就意味着它能理解这个世界。而且人类的语言可以描绘世界，谁理解了语言，就意味着建立了对这个世界完整知识的图谱。之前，人类做知识图谱很多年都没有做成，因为知识太难表征了，你对一段话中的每一个概念都理解，才能理解整段话。所以通用大语言模型能理解语言，能完整地理解问题，意味着计算机对世界有了基本的认知。

实际上，大模型已经是对于世界最好的理解模型。有了这个能力以后，人工智能就获得了突飞猛进的变化。之前的人工智能软件，比如机器视觉、人脸识别，以及自动驾驶，都是工作在感知层面，而大语言模型工作在大脑层面。有了这种能力以后，在基于对这个世界建立了完整了解的基础上，你再训练人工智能做其他工作，一切都变得简单。过去电脑伪装成人跟你聊天，正常人是聊不下去的，但是今天你问任何一个GPT产品，它都会告诉你，我是AI助手。它有信心，即便我是机器人，也跟你聊得下去，因为你说的每句话我都理解，都能对答如流，这是一个划时代的能力。

第三，大模型将引领新工业革命。大模型是一个什么级别的发明？比尔盖茨说，它不亚于电脑和互联网的发明。黄仁勋说“这是iPhone时刻”，iPhone引领过无线互联网革命。我觉得大模型是工业革命级的科技进步。第一，它的定位很清楚，尽管可以把它当做聊天机器人，但它实际上是一个生产力提升工具。第二，引发工业革命的一定是通用的东西，1946年电子计算机被发明，但是它没有引起工业革命，因为最初的计算机都是专用的，属于政府有关部门、军队、气象部门。只有当PC被发明了，每个家庭、每个人都买得起电脑以后，才引发了革命。iPhone也是，之前的手机是非常有用的通讯工具，但iPhone是一个计算平台，可以实现更多通用功能。

我认为当前的大模型就到了这样的时刻。在大模型之前，尽管大数据很重要，但是没有引起工业革命，因为大数据不能直接用，如果一家公司想要用大数据，需要找人做分析，成本很高。但是大模型不一样，把大数据输进去，练成大模型，可以提供很多通用人工智能的能力，帮你写文案、做规划、做讨论，帮你阅读一些文章。而且大模型的能力不用跟各行各业结合，就已经可以提升各行各业了。

所以，大模型就是新时代的发电厂。有了电以后，才有了又一次工业革命。现在各位无论做什么工作，只要你的企业想升级，要做数字化，一定离不开大模型，这个红利期将至少有五到十年。

最近，OpenAI有两个新动作值得大家注意：一是为ChatGPT加了插件。大模型不是万能的，它善于做知识推理、规划和与人的交互，但也做不了很多事，比如订房、订餐、跟互联网连接，所以OpenAI做了一个插件平台。二是他们又做了函数调用能力，不是程序员的人很容易忽略这件事。实际上它做了函数调用以后，就可以把公司业务系统里的函数暴露出来，大模型就可以跟公司的业务系统对接。比如你跟它聊天，要看一看公司这个月的营收，然后它能调用一个函数，去查公司的数据库，这样大模型跟公司的业务就融合在一起了。

所以，最近大模型的变化日新月异。对于一个新生事物，一定要看它的正向发展，不要被它暂时的缺点迷惑，比如它有时胡说八道，回答问题很可笑等等。这些缺点掩盖不了两件事，第一它在飞快迭代，第二它不是孤立的存在，还可以做中间件，做函数调用，做插件平台。就像你做出了一个发动机，总会有人给它配上轮子、底盘，这些东西凑在一起，就有了汽车。

03
关于大模型发展的四个观点

下面分享我对当前大模型发展的四个新观点。

观点一，百模大战已经进入场景比拼阶段。

现在全世界已经是百模大战了，好像每个公司都能做出大模型。其实做出大模型不难，关键是易学难精。

做一个大模型有几个关键：第一，选择一个基础模型，这件事过去很麻烦，但现在感谢开源环境，代码是现成的，不需要自己写，真正的挑战在于后面的步骤。第二是无监督学习。新一代大模型一个很重要的优点就是无监督学习，过去训练人工智能，所有东西都要标注，但是学习人类知识时会陷入悖论，因为你不可能把所有人类的知识进行标注。大模型则只要是正确的知识，足够多以后，知识和知识可见相互验证、相互联系，就不需要标注。接下来是有监督调优，把几十万，甚至上百万人工标注好的问题和答案对，给到机器，说白了就是刷题。跟人类一样，有些题没见过，它真的不会做；选得好，它会举一反三。然后是价值观对齐，就是让它的回答和人类价值观对齐。机器是由人的训练决定的，曾经有人拿聊天知识库训练聊天机器人，很难用，因为它学习的不是知识，没有逻辑，最近科学家证明，如果拿晦涩的论文、高难度的大学课文、复杂逻辑文章做预训练，训练出来的模型才能更有逻辑性，像现在公众号的文章，为了阅读方便，都是一句话一段，没几句话就是一段图，这种低质量的文章不适合做训练语料。最后是用户训练和反馈。这一步很重要，一定要放到互联网上，有海量的用户来使用。我们自己做测试，测试能力有限，哪怕100道题也是非常片面的测试。只有用户一天问上百万个问题，有的满意，有的不满意。找到错误案例，进行修正，才能进步。

今天做出一个大模型不是很难，难的是用数据去训练大模型，以及有没有场景去使用。现在大模型已经不是核技术了，就像PC出现之后一样，开始技术民主化了，不再像网上说的，ChatGPT训练一次要1000多万美金。但是要想做GPT，大规模、多样性、高质量的训练数据必不可少。360做搜索，每天抓数据，要判断数据质量，因此在数据量上还可以，可以给大家提供预训练的基本数据。

大流量、工程化、高稳定的训练方法也是至关重要，目前大家都在炫耀自己的算力，有多少显卡，但怎么让显卡一起协同工作，这是一个挑战。

尽管OpenAI很了不起，在没有任何场景情况下，构建了通用人工智能。但毕竟大多数公司不是OpenAI，都是凡夫俗子。现在全世界都有共识，世界上不能只有一个大模型。ChatGPT再牛，关于你所在行业问一些深入问题，会发现它比你差远了。黑马之前提过重度垂直的概念，这在大模型领域依然适用。

我们做大模型时，一定要紧扣场景。现在大模型展示的能力从办公来看是够用的，但是一定要能跟中小企业做深度结合。举个例子，很多人在小红书和抖音上做不同的文案，我让它专门写抖音文案，就是一个微观场景。用它的能力结合实际场景，才是用户真正需要的东西。多场景有效落地，可以让大模型真正服务用户。

观点二，国产大模型弯道超车的关键是发展多模态。

现在国产大模型追赶ChatGPT的脚步，比我预想的要快。这还要感谢整个行业半年来公开的技术、培训的方法，以及训练的数据库、数据集越来越多，甚至很多新做的大模型，是以GPT-4作为老师，用GPT-4产生的很多问题和答案来训练。

我认为大模型未来一个重要的发展方向是多模态。看看ChatGPT的发展，GPT-1到2是参数的变化，3是进入千亿模型，实现涌现，GPT-3.5是让它有了问答和对话能力，GPT-4除了能力比3.5强很多以外，也展示了多模态的能力，就是图生文、文生图，相对比较简单，GPT-5最大的可能性就是多模态，会更加理解这个世界。

多模态包括必不可少的四大关键能力：第一，文字处理能力；第二，图像处理能力；第三，语音处理能力；第四，视频处理能力。

我们今天彼此交流，就是彼此训练的过程。你们听我讲，就是我给你们输入，你们在训练。曾经有人质疑，人类目前总共就出版过几亿本书，据说有一半的书都训练给GPT了，马上就无法训练了。其实只要把满大街的摄像头接入GPT，我们在哪说话，在哪开会，说什么，它能听懂、看懂，这将会是一个更高级的训练，对于增加它对这个世界的理解，将会是非常强大的。

传统的视觉识别，只能认出图上有什么，但理解不了这张图的情感、氛围、逻辑和背后的故事。现在的大模型识别，各家的引擎差不多，真正要画一张符合特定需求的好图，至少需要几十个、上百个Prompt，所以将来垂直的小模型有巨大的机会，而不一定是什么都能干的通用大模型。

观点三，数字人是大模型未来最重要的应用入口。

其实，并不是每个人都要从零开始做一个大模型。我们想用大模型解决问题，最大的机会在于，怎么让大模型更好用，而不是每个人都成为提示词专家。这就需要定义一种新的角色，叫数字人，作为大模型的应用入口。

上一次黑马AIGC产业大会我嗓子出问题了，没有来，就派了一个数字人，但它还是传统的数字人，没有性格和记忆，跟人无法互动。我们希望打造有灵魂的数字人，甚至能复刻某些名人的人生经历，希望有人设、有经历，这里面的机会很大。

现在有很多开源方法在探讨。有一个方案是，既然大模型没有记忆，没有目标，不回答你的问题时它在沉睡，我可以做一个外部程序，可以把大模型驱动起来，对话完以后进行保存，使它有记忆；或者把一个任务分解成多个目标，用不同的模型来完成。

360推出了AI广场，可以做出分类角色。

这种角色可以是娱乐化的，比如我做了一个数字人叫曹操，我经常问他，为什么放关羽走，为什么杀掉吕布。还可以做成数字名人，比如孙悟空、林黛玉等等。

今天大模型跟你的耦合，就是一个聊天机器人，可以解决办公和知识管理的问题。如果跟企业的业务相融合，就需要一些新模式了，可以借助大模型，打造一个数字人。

比如“数字员工”，把大模型定义成不同领域的专家，游戏的产品经理、社交媒体的运营、小红书的运营专家等，把它定义得越细越好。我们人类不愿意跟人打交道，把它包装成各种数字人以后，人跟“人”的交流，使用起来会更加通畅。过去只有老板有助理，以后普通员工想要几个助理就有几个助理。

甚至可能实现数据永生。想象一下，今天给一个人身上挂一个行车记录仪，他写了什么微博，发了什么朋友圈，讲了什么话，攒一年到两年的数据，训练一个大模型出来。我们跟这个G大模型聊天，它可以学到一个人的思维模式，而不是只是模仿原话，就可以实现一定程度的数字永生，也是一种知识的传承。

观点四，大模型未来的增量市场在企业级应用。

尽管我们可以用大模型做出各种娱乐应用，但娱乐应用的场景，已经被互联网巨头割据了，我不认为有创业公司的机会。按照我前面的观点，既然是工业革命级，一定是企业和行业的生产力倍增工具，所以，我认为大模型未来的增量市场是在企业级应用。

其中一个机会在中小微企业。因为中小微企业即使买了一个GPT账号，也一定不会用。可能全公司只有一小部分人会用，大部分人还不会用。学Prompt的难度就像学编程一样，你不知道说哪句话，数字人就开窍了，回答得特别好，你把某个词改一下，他就像白痴一样乱说。所以中小企业比较大的机会，是在大模型API基础上，定制完成具体工作的数字员工。

第二个机会是行业垂直大模型。像黑马做的科创大模型就是其中的一个。

第三个机会，给企业和城市部署私有化大模型。如果你的企业规模很小，通过上传建立自己知识库的方式，建立自己的私有客服机器人，这是可以的。但作为中大型企业，用大模型首先存在数据泄露的风险，其次是公有大模型缺乏深度行业知识。所以，做一个对你所在行业和企业更了解的大模型，这是目前最大的机会。这些公司都是行业翘楚，有深刻的Know how和内涵，行业的知识未必被掌握在大模型手里，也未必在公网上可以抓到。

此外，使用公有大模型无法支持知识及时更新，大模型隔一段时间才能训练一次，目前做不到实时训练，这也是一个挑战。

而且，公有大模型无法实现组织内部权限的分级管理，这又是一个挑战。

所以，大模型既有巨大的需求，也有一系列挑战。这些挑战，就是未来的机会。

大模型有一个优点，目前的训练成本极大降低。每个企业最大的资产，就是企业内部的知识和Know how，这是不能外传的，但是做成大模型，就能解决企业内部知识的传承问题。找到一个大模型，由360做了基本训练以后，企业进行行业数据和企业数据的训练，这样就能训练出一个专有大模型。

专有大模型怎么用呢？我认为至少可以先做四件事：第一是员工知识助手，第二是员工的办公助手，第三是领导的决策助手，第四是企业的智能客服。

我们经常听人说，哪个行业领域的“水”很深，说明这个领域都有大量深奥的行业内部知识，这也恰恰是私有大模型巨大的机会。