百度沈抖：企业选择大模型需看三大指标

2023-06-12 11:06

全球新一轮科技与产业变革，被生成式语言大模型迅速引爆，对于大模型的行业前景和价值，学术界、产业界、投资界罕见地达成共识，然而到了大模型产业实践落地之际，企业还是得面对一道道难题：市面上眼花缭乱的大模型，应该如何选择？想基于大模型重构业务，要做好哪些准备？

百度集团执行副总裁、百度智能云事业群总裁沈抖表示，企业选择基础大模型要看三大指标。

第一是通用性能，要看大模型能不能满足企业当前的需要，有没有比较好的泛化能力。第二是大模型的迭代速度，这将决定大模型在未来的长久价值；第三是工具链是否完备，不管是基于基础大模型做行业大模型，还是开发AI应用，都会涉及到非常多工程化的问题，工具链会决定企业能不能更好地把大模型的能力融入到业务和产品中。

沈抖判断，未来所有企业都将强依赖大模型，所有产品都会基于大模型开发。因此，企业应该从现在开始做好重构产品和服务的准备，这种准备既包括基础设施层面，也包括思维方式、组织方式层面。

在基础设施建设层面，沈抖表示：“只有先把大模型搭建起来，把企业中的数据和业务跟大模型链接起来，才能真正体会大模型的价值。”他补充，大模型提供了基于自然语言的编程范式，让人人都能成为程序员，企业里所有有创意、有想法的人都可以轻松地去验证自己的新想法，这一定会激发创造力、提高生产力。

他认为，每个企业都应该在组织内部构建“AI原生思维”，重新思考产品、服务与用户的关系，重新思考如何用大模型放大自己的优势，拓展自己的优势领域。不是去想着怎么用AI替代人，减少员工，而是怎么赋能员工拥抱新技术、创造新价值。

沈抖鼓励企业去持续尝试，反复验证，不要怕试错，因为任何一个企业应用新技术的过程都未必一帆风顺，这时企业一把手的信念和决心往往能起到决定性因素。

“如果大模型带来的产业智能化变革势不可挡，那我们唯一要做的，就是赶快行动。”沈抖说。

以下是沈抖的演讲实录。

口述：百度集团执行副总裁、百度智能云事业群总裁沈抖

来源：正和岛（ID：zhenghedao）

大家好，今天新华三“领航者峰会”的主题是：精耕务实，为时代赋智慧。“精耕务实”是一种态度，“为时代赋智慧”是一个目标，当心中有了态度，眼中有了目标，接下来要解决的问题就是，我们手上有什么样的东西可以帮助我们达成目标？

站在2023年，“为时代赋智慧”的手段已经基本达成了共识，那就是大模型。这也正是我今天要分享的主题。为什么现在学术界、产业界、投资界都在关注大模型，因为大模型背后意味着两个重要的事情。

第一，大模型重新定义了人机交互。在过去几十年，人机交互发生过三次大的变化：

我读大学的时候，还有命令行的工作界面。输入命令，它给我反应，我当时觉得效率很高，但大多数人不再会这种操作了，门槛太高。

后来的图形界面更简单直观，就是用鼠标一层一层点击菜单，但仍然不是最自然的方式。大家都有过这样的经历：在用某个软件的时候，很多长尾的功能藏在很深的菜单里，很难找到。

大模型的出现，让我们可以用自然语言跟计算机进行交互。比如我想知道“百度智能云的产品毛利率，哪些超过了疫情前的水平”，过去需要花半天才能整理出来，今天计算机能听懂指令了，几秒钟就能给出结果。

人机交互的每一次变革都影响深远，不仅带来极大便利，也创造出无数的新机会。未来人们只需要用自然语言提出需求，大模型就可以理解需求、生成内容，并调起各种工具为我们服务。

第二，是宏观层面，生成式AI大模型的出现意味着一种新的生产力正在诞生。

18世纪80年代以前，世界人均GDP一直都很低，直到最近200年才突然爆发式增长，这主要得益于三次工业革命：蒸汽机、电力和信息化。GDP和科技革命的强相关性，印证了我们大家都非常熟悉的一句话：科技是第一生产力。但我们深入来看的话，这几次科技革命又不尽相同。

前两次科技革命——蒸汽机和电力武装了人类的体力；第三次科技革命——信息化，辅助了人的脑力，但依然扮演着工具的角色。

而这次以人工智能为代表的科技革命，尤其是最近大模型的出现，催生出一股新的力量，从辅助脑力的角色向代替脑力的角色演变。这是更高层面的科技生产力，这将彻底改变所有行业。

但是，想要做出好的大模型并不容易，需要具备三大要素：大数据、大算力、好的学习机制。

首先是大数据，就像人不是生下来就是全知全能的，必须有后天大量的学习。一个千亿参数级别的大模型需要大量数据素材，比如各种唐诗、新闻、论文、代码库等等，这个数量大致相当于上百万人一生的阅读量。

其中，数据量只是大还不够，还需要大量高质量的标注数据，OpenAI在他们的论文里提到，他们招聘了非常多的领域专家负责标注数据，基本覆盖各个行业，这些领域专家中有37%是硕士学历。

第二是大算力，这是大模型的动力来源。训练大模型所需要的计算量由大模型的参数量和训练所用数据量的乘积决定。

以GPT3为例：每训练一次，大约需要计算10的23次方次。这是什么概念？1块A100芯片平均每秒钟可以运算20万亿次，1000块芯片需要计算100天。如果换算成全世界80亿人同时打算盘，一刻不停也要算100万年。

除了大数据、大算力，还需要好的训练方法。相当于我们人类需要一个好的教育体系、好的老师来指导成长。

使用同样的数据、同样的参数规模，用不同的方法，训练出的大模型效果可能很不一样，就好像不同厨师拿同样的食材、用同样的厨具，做出来的菜味道也不一样，有的好吃，有的不好吃。所以说，长期积累的经验也是大模型能否好用的关键。可见，训练大模型是一个很复杂的系统工程，需要整个技术栈的升级。

过去，无论是PC还是移动时代，IT技术栈都是三层，芯片层、操作系统层和应用层。在人工智能时代，IT技术栈变成了四层：

底层仍然是芯片层，但主流芯片从CPU变成了GPU，为大模型中大量的并行计算提供服务。百度在芯片层的布局是昆仑芯，已经有几万片的部署，昆仑芯第三代预计在明年初上市。

芯片上面是框架层，主要是指深度学习框架，极大地降低了模型的使用、开发门槛，并且将模型与算力磨合得更好。百度的飞桨，Meta的PyTorch，谷歌的TensorFlow都是在框架层。百度飞桨在中国市场份额第一。

框架上面是模型层，模型是基于下面的框架和芯片训练出来的，GPT、文心一言都属于模型层。除了文心一言，百度还有交通大模型、能源大模型等11个行业大模型。

最上面才是应用层，基于通用大模型，结合具体的行业场景，一定会出现大量新的AI原生应用。

目前百度是全球为数不多的，在四层架构进行全栈布局，且每一层都有领先产品的公司。

实际上，在生成式AI出现之前，辨别式AI已经在产业中广泛应用。比如图像识别、文字识别、语音识别等等，百度已经向客户提供了上百个AI接口。

过去这些大多都是单点应用，就像眼睛、耳朵等等，大模型的出现让它们有了一个大脑，可以将过去的各种AI能力组织起来，更好地提供服务。随着大模型的发展，多模态融合会更加自然、高效。

这种多模融合的AI，一方面会全方位重塑我们的生产过程，带来生产经营效率的极大提升；另一方面，就像刚提到的，它会使得人和计算机之间的交互变得更加自然友好，用户体验的效果将会极大提升。

大模型带来的“双效提升”，必然推动整个社会加速实现“智能化跃迁”。目前我们看到，全球主要的科技公司，像是微软、百度，大家在基于大模型把全部产品重做一遍。不是整合，不是接入，而是重做、重构。

那么，在这个“智能化跃迁”的过程中，企业首先会关心的一个问题是：我的业务场景能不能和大模型结合？哪些场景会率先落地呢？我们通过大量企业调研发现，企业在5大领域对大模型有非常强烈的期待，分别是：知识管理、营销、代码生成、设计、对话。

今年3月文心一言发布以来，百度自己的产品和外部客户都在积极尝试，联合测试大模型在具体场景中的应用。

比如在知识管理领域，百度内部的智能工作平台“如流”上有一个超级助手，员工可以问它各种公司政策、和工作有关的知识，还可以预约会议、创建日程、饭卡充值等等。

在办公领域，我们和几家头部的办公软件公司合作，通过对话，能快速生成PPT、简历、合同等内容。只需给出诉求，几句话就能完成一份条款清晰的合同初稿。

在营销领域，我们帮助商家一键生成各种风格的营销文案和种草笔记，并通过数字人实现7*24小时直播带货。

在智慧政务领域，我们和政府机构联合测试了城市智慧平台的交互式场景，例如，直接问“预计端午期间的客流量如何”，就能自动生成分析报表并回答。

在代码生成领域，百度智能云推出了基于文心大模型的代码助手“Comate”，它可以结合上下文，预测程序员接下来想要输入的代码，还能用自然语言来写代码，并且自动查找代码中的错误。Comate代码助手已经在百度内部进行了大量测试，AI推荐的代码采用率能达到50%，未来，开发者可以通过插件等形式，在主流开发软件中使用Comate。

在大模型时代，所有企业都会是大模型的共建者，但也一定会有不同的角色分工。

第一种是负责构建基础大模型的，一定是少数企业。训练大模型的成本和技术壁垒都非常高，需要长期在大模型领域深耕，而且需要充足的算力储备、数据储备、高端AI人才储备。

第二种是负责建立行业大模型的企业，通常是了解行业know-how的企业。他们可以结合自身掌握的行业数据，基于基础大模型精调出更贴合实际场景的行业大模型。

第三种是在基础大模型和行业大模型之上，开发AI应用的企业。这类企业要思考的是：如何选择一个好的大模型、如何在这个大模型之上做好提示词工程，解决特定应用场景的问题。

大家都说，现在是百模大战。企业应该如何选择基础大模型呢？从我们对全球主流大模型的测试和观察来看，主要是三个考量指标：

第一，要关注基础大模型的通用性能。看它能不能更好地满足当前的需要，有没有比较好的泛化能力。

第二，要关注基础大模型的迭代速度。现在大模型还没有到完全成熟的阶段，技术的迭代是非常快的，所以不但要看一个大模型今天好不好，还要从技术积累和研发投入的角度，来判断它未来能否快速迭代、越来越好。

第三，不仅要关注模型本身，还要看相关工具链是不是完备。不管是基于基础大模型做行业大模型，还是开发AI应用，都会涉及到非常多工程化的问题，比如数据采集、数据标注、模型的再训练，各种微调和插件等等，工具链会决定你能不能很容易地把大模型的能力带到业务和产品中。

为了加速大模型在产业上的落地，百度智能云推出了全球首个一站式企业级大模型平台，文心千帆大模型平台。千帆平台不仅提供文心大模型服务，也支持第三方的大模型，我们提供了齐全的工具链、完整的开发环境和基础设施，帮助企业用上、用好大模型。

在性能方面，我们具备全球领先的性能指标，通过我们的优化技术，千卡并行加速比达到了90%以上，训练场景资源利用率达到70%以上，整个大模型开发和迭代效率跟没有优化前相比能提升100%。

在部署方式上，文心千帆大模型平台支持公有云和私有化部署，能满足不同客户的部署需求，让每个企业都能享受到大模型的技术红利。

在文心千帆大模型平台的支持下，文心大模型正在快速进化。自3月开始内测，两个多月以来，文心一言已经迭代4次，推理性能提升了10倍。在企业应用的一些高频、核心场景中，在满足客户同样需求的情况下，基于文心一言的高性能模式“文心一言-Turbo”，推理性能提升了50倍，极大提升了模型的使用效果和效率。

相信大家都能感觉到，很多企业已经开始行动起来、迎接大模型了。目前，已经有15万家企业申请接入文心一言测试。我们已经和300多家生态伙伴，在超过400个场景中取得了不错的测试效果，覆盖金融、政务、互联网、教育、工业等行业。

其中就包括像新华三这样的数字化解决方案领导者。作为百度文心一言首批生态合作伙伴，新华三强大的平台搭建能力和渠道延伸能力，一定会加速大模型在中国的落地应用。

我们能感受到的另外一股力量是基于大模型的创业创新。5月底，百度宣布将拿出10个亿成立AIGC领域的专项投资基金，并启动“文心杯”创业大赛，给优秀的企业和项目提供大模型能力和云计算资源的支持。开始报名仅一周时间，已收到近300份参赛申请。

未来，所有企业都将强依赖大模型，所有产品都要基于大模型开发，这已经成为了一个产业共识。所以，从现在开始，我们就要做好重构产品和服务的准备。这种准备既包括基础设施层面，也包括思维方式、组织方式层面。

首先，要先布局好大模型这个基础设施。无论通过公有化还是私有化部署，只有先把大模型搭建起来，把企业中的数据和业务跟大模型链接起来，我们才能真正体会大模型的价值。尤其是大模型提供了基于自然语言的编程范式，搭好了基础，企业里所有有创意、有想法的人都可以轻松的去验证自己的新想法，这一定会激发创造力、提高生产力。

其次，要在组织内部构建AI原生思维，重新思考产品、服务与用户的关系，重新思考如何用大模型放大自己的优势、拓展自己的优势领域。这时候，我们首先要想的不是怎么用AI替代人、减少员工，而是怎么赋能员工拥抱新技术、创造新价值。

第三，要持续尝试、反复验证，不要怕试错。我们知道，新技术的发展趋势是确定的、不可逆的，但是具体到一个企业应用新技术的过程不一定一帆风顺，这时候就看企业一把手和主要领导的信念和决心，最先坚持跑通的企业，一定是最有竞争力的。

所以说，如果大模型带来的产业智能化变革势不可挡，那我们现在唯一要做的，就是赶快行动。

回头看过去十几年，智能手机的诞生，把手机分成了智能手机和非智能手机，非智能手机已经彻底退出了历史舞台，这波生成式AI的广泛应用，正在把企业分成智能企业和非智能企业，而非智能企业也会慢慢消失。

AI的终极理想，是为人类带来更多自由和可能。今天，我们已经迈出了大模型在中国产业化落地的第一步。中国拥有全球最大规模的网民和最庞大的产业链，这会产生大量最真实的用户反馈和行业需求，进而推动大模型持续进化。

我们愿与在座的诸位一起，将中国的智能化跃迁推向更深、更广的领域。谢谢大家。

以下为视频回放：

排版 | 武小周

编辑 | 正风主编 | 孙允广

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章