文心一言开启国产大模型时代,应用新机遇
文:任泽平团队
导读
第四次科技革命以创新为特征,作为第四次科技革命中的主要技术,人工智能的创新突破令人鼓舞。国外ChatGPT已迭代至GPT-4阶段,具备更加强大的功能。
但软件卡脖子忧虑随之而来,ChatGPT本质上是深度学习框架和大模型应用不断创新的产物,它们又是强人工智能时代的基础软件和操作系统。值得庆幸的是,国内以百度为代表的科技大厂正在相关方面创新突破,文心一言的推出振奋人心,催生新模式新业态,人工智能大模型国产化新浪潮已至,国产大模型走向世界指日可待。
我们提出“新基建2.0”概念,“新基建1.0”在于建,“新基建2.0”在于用。建不是目的,用才有价值。“新基建2.0”,不仅是基建变革,更是应用场景和生态变革。
AI大模型正逐步深入到生产领域的每一个核心场景,百度创始人、董事长兼首席执行官李彦宏认为“大模型时代,最大的创业机会在应用。移动互联网时代,操作系统其实没几个,最成功的是微信、抖音、淘宝这些应用。未来10年,可能诞生10倍价值于他们的机会。”未来创业者将围绕大语言模型做应用,最大的创业机遇在应用端。更加强大的交通大模型、能源大模型、金融大模型、医疗大模型等等一系列应用大模型,与产业进一步融合,将迸发出巨大的市场潜力,新业态新机遇。
正文
1 大语言类模型引爆“大模型+”,新业态新机遇
人工智能是第四次技术革命中的重要技术。近期ChatGPT的火爆出圈,再次引发了全球对人工智能技术发展的广泛关注。强人工智能时代或将来临,类似ChatGPT的大语言类模型可完成撰写邮件、视频脚本、文案、翻译、写代码、写论文等各种任务。搜索引擎、内容创作、文案撰写、法律咨询等行业将面临挑战,而智能驾驶、人工智能搜索、AI内容创作等新模式新业态可能迎来增长空间。比如在内容生产上,AIGC自动生成内容的生产方式,让内容生产变得高效容易,富有个性,它可以创建文本、音频、图像、视频、3D 模型,逐渐成为内容生产创作的重要力量。通过利用AI技术,AIGC能在大数据帮助下提升创作效率,突破创作内容和创作量上限。
现阶段,各界海量的数字化需求,使得大模型路线以“通用智能”思路降低算法边际成本,增强人工智能落地应用场景的经济性。大模型不需要每次就单独的项目派出大量专家花数月驻场收集数据、调试模型、进行训练模型等。只需用大量数据和足够大的算法去训练一个足够大的通用模型,再通过量化、剪枝、知识蒸馏等模型压缩方法把大模型变小,就能高效地进行模型生产,可避免“手工作坊”的AI生产方式,能够覆盖各种长尾场景,大大降低复制成本。
第四次科技革命,增长将由创新驱动。如果不能持续性进化创新,就算是行业的领军企业也会像相机行业面临“柯达时刻”、手机通信行业面临“诺基亚时刻”一样轰然崩塌。
以近年持续火热的新能源汽车市场为例,2022年,新能源汽车总销量688.7万辆,同比增长93.4%,渗透率达到27.6%,新能源汽车替代传统燃油车已成为大势所趋。2023年补贴退坡,未来新能源汽车产业将完全进行市场化竞争,后发进入新能源汽车行业的的奔驰、宝马、奥迪等三家豪华车巨头,将可能面临汽车行业的“BBA”时刻。一系列行业现象表明不适应发展时代浪潮、缺乏创新的企业终局将是被淘汰。
未来更多如视觉、听觉等创新性的人工智能大模型将会被陆续推出,解决各类产业问题,并有望催生新的商业模式、创造新的业态,成为下一个经济增长的新引擎。百度创始人、董事长兼首席执行官李彦宏近日在亚布力企业家论坛中提到,大模型带来的增长机会主要集中在三个方面,一是新型的云计算,商业模式变成模型即服务(MaaS),未来云服务的优劣将更多取决于框架、模型,以及模型、框架、芯片、应用这四层之间协同;二是进行行业模型精调的公司,作为通用大模型和企业之间的中间层,通过调用通用大模型能力,它们能为行业客户提供行业解决方案。例如百度文心大模型,已经在电力、金融、媒体等领域发布了10多个行业大模型;三是应用服务提供商,创业者将围绕大语言模型做应用,未来可能涌现出一批创业明星公司。
大背景下,全球各大科技企业的大模型将在持续创新、迭代升级中开启时代角逐。“大模型+”风口来临,新模式新业态,企业新的增长点,兵家必争之地,未来更好用的大模型将成为人工智能时代竞争的关键。
2 重视软件卡脖子问题,国产大模型亟需走向世界
基础软件是推动信息技术发展的根本驱动力。回望过去的信息时代和移动互联网时代,蓬勃发展的关键节点都是开放操作系统的出现,例如Windows系统、Android系统。进入人工智能时代,推动发展的操作系统变成了基础软件,如深度学习框架等。
而进入到通用人工智能时代,大模型应用将成为这个时代的操作系统。然而,近日国家科学技术部部长指出,我国人工智能自然语言处理模型要做到ChatGPT算法的实时性和有效性并不容易,还需要做大量的工作。目前国外的ChatGPT模型已升级迭代至GPT-4,是功能更加强大的模型,可只用一张草稿图便生成网站的HTML代码,能够在模拟考试中拿高分等。类似于半导体的硬件卡脖子,国外的通用大模型如此强大引发了社会对软件卡脖子问题的担忧。如果我们过度依赖国外的深度学习框架,未来一旦它们被“战略闭源”,中国就有在关键领域被“卡脖子”的风险。因此,国内亟需破局之道,需要大厂引领、技术突破,破除卡脖子忧虑。
近期,百度新一代大语言模型的生成式AI产品文心一言正式开启邀测。基于对标世界级语言模型ChatGPT,叠加大厂的积累优势,在持续创新迭代下,未来文心一言将有望做到“人有我有,人有我优,以及人有我待优”。
具体来看,百度有世界上最大的知识图谱,对比国外的大语言类模型,文心一言具备较强的文学创作能力、商业文案写作能力以及数理逻辑推算能力,做到人有我有。更进一步地,文心一言扎根于中国市场,理解中国文化,中文语言处理能力独一无二;还可多模态地生成文本、图片、音频、视频等,就像学霸一样,随着百度多模态统一大模型的能力增强,文心一言在不断学习中,其多模态生成能力也会不断提升,“士别三日,当刮目相看。”文心一言开始使用后,将建立真实用户反馈、开发者调用和模型迭代的飞轮,进步飞快,做到人有我优,及人有我待优。
对比OpenAI这类初创公司,科技大厂有资金和技术的积累优势,类似百度这类大厂参与“大模型+”竞逐,有望弯道超车,国产大模型将走向世界。
对于GhatGPT、文心一言这类的大语言模型,无论哪家公司都不可能短时间内做出,深度学习、自然语言处理等技术需要多年的坚持创新和积累,可见以百度为代表的数字新基建企业正从基础层、技术层、平台层到应用层等多个层面的数字基础设施建设出发,尝试缓解我国软件卡脖子的担忧。
一是在基础层,人工智能新基建参与企业逐渐完善掌握海量数据、构建机器学习核心算法,并向高运算力芯片等核心硬件环节突破发展。
人工智能时代,更多不规则、非线性、复杂场景大数据运算对软硬件整合提出了新要求,芯片和算法的关系逐步走向相互定制融合。在此背景下,致力于人工智能新基建的企业开启“涉芯”、“造芯”成为未来发展的必然。
2021年,百度自主研发的第二代AI通用芯片“昆仑2代”开启量产,采用领先7nm 制程,搭载自研二代 XPU 架构,相比前一代性能提升2-3倍。未来将持续在芯片商用性、通用性,以及多维生态建设方面持续发力,面向云计算、自动驾驶等多种人工智能应用场景,形成自主芯片生态圈。
二是在技术层,计算机视觉识别、语音交互、自然语言处理等技术不断取得重大落地应用。
比如随着计算机视觉、语音合成等人工智能技术“基础设施”的发展,具有“思考学习”能力,外形、动作、表情逼真,语调、语气、说话风格自然流畅,对话内容及时反应的“虚拟数字人”逐步得到商用发展。
三是在平台层,人工智能新基建参与企业逐步搭建了中国人自主研发的基础开源框架,不断推进产业级深度学习平台、技术开放平台建设。
通过调研发现,当前主流人工智能新基建参与企业多采用“平台+赛道场景”的战略架构,“平台算法-场景数据”形成持续闭环迭代。积极构建自主研发的 AI开放平台,一是为海量的智能硬件、软件开发者、用户提供AI开发能力和解决方案,好的深度学习框架平台,推动人工智能标准化、自动化、模块化,进入人工智能工业大生产阶段。二是开放平台赋能各行各业,好的平台框架,可以驱动AI普惠,对各行业产业数字化进程起到积极推动作用。
为更好应对外部环境变化,作为国内深度学习开源框架的先行者,百度研发搭建了“飞桨”平台,使得我国拥有更加自主可控的AI底层能力,目前国内市场份额已位居第一,逐步实现了对TensorFlow和PyTorch等外国平台的超越。
四是在应用层,人工智能新基建参与企业为多行业、多产业领域持续赋能,人工智能+家居、工业制造、机器人、医疗、教育、汽车出行、司法等多个关键核心领域,实现各场景数字资产沉淀,深化各行业全流程体系变革。
百度拥有飞桨框架、文心大模型等,集合了各种各样的不同场景的算法,让企业可以拥有模块化应用AI的能力,快速输出想要的结果。文心一言就是文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
3 趋势和展望:模型迭代升级,助力产业智能化发展
我们提出“新基建2.0”概念,“新基建1.0”在于建,“新基建2.0”在于用。建不是目的,用才有价值。“新基建2.0”,不仅是基建变革,更是应用场景和生态变革。
人工智能新基建是一项系统化工程,既包括网络、计算、存储等硬件设施,又涵盖数据算法、开源平台等软实力领域,还需要对每个行业领域智能化赋能,实现应用成果落地。
随着国产大模型、新秀不断涌现的多模态模型、通用能力模型等百花齐放,模型的迭代正在加速,AI正从感知智能加速向认知智能迈进。从“能听、会说、会看”的感知智能,走向“能思考、能回答问题、能总结、做翻译、做创作”的认知智能,未来将走向“决策、推理”的层面。AI大模型正逐步深入到生产领域的每一个核心场景,帮助企业实现智能化决策,为企业带来效益。从最初智能客服的场景,逐步深入到工艺参数优化、安全预警管理等核心领域。
例如在工业质检领域,百度推出了TCL-百度·文心行业大模型,将传统的工业质检算法流程进行了变革,大幅提升了模型的研发与运营效率,实现降本增效。以半导体显示面板缺陷检测任务为例,TCL-百度·文心行业大模型的应用可使训练样本降低30-40%,开发周期降低缩短30%,同时冷启动效率可提升3倍,指标可提升10%。又如在金融领域,百度推出的泰康-百度·文心行业大模型,助力泰康保险在典型应用任务场景下的平均字段识别率提升至90%以上。
微信扫码关注该文公众号作者