人工智能能有多聪明,取决于这两个字
当代打工人,已经感受到人工智能带来的“寒气”。
今年以来,GPT-4 被陆续报道高分通过法律、医学、会计等领域的考试 [1]。不仅如此,GPT-4 还通过谷歌工程师面试拿到了年薪 18 万美元的 offer [2],这让不少打工人开始担心被 AI 抢饭碗。
但现在对 AI 的未来下判断,可能还为时尚早。毕竟 AI 再怎么发展,背后还需要算力、数据等庞大资源的支持,比如国盛证券分析 ChatGPT 初始算力投入成本约 7.59 亿美元,每日电费就达到约 4.7 万美元 [3]。
今年六月份,刘慈欣在采访中也认为人类所能提供的算力是有限的,人工智能迭代到一定程度,我们的算力就不能支持它了 [4]。
无所不能的的 AI,怎么被算力限制了?在一路狂飙的智能时代,我们该如何突破算力瓶颈?千行百业,怎样才能把握住这次机遇,挖掘创新增长潜能?
算力,怎么卡住了 AI 的脖子
算力,顾名思义是一种计算能力,比如依靠人脑的口算、心算也是一种算力。
在数字时代,互联网中的信息、互动都是由大数据组成,并由算力处理、计算才得以运作。因此,算力被视为继热力、电力后的核心生产力。
在当下,算力几乎像空气一样无处不在。从微观看,每个人能不能正常上网,都是算力说了算。而从宏观看,算力则关系到一座城市、一个国家的数字经济发展。
根据《2021-2022 全球计算力指数评估报告》,算力指数平均每提高 1 个点,国家数字经济和 GDP 将分别增长 3.5‰和 1.8‰ [5]。
而当 AI 终于不再是“人工智障”后,各行各业都希望能快点乘上这股东风,现阶段对算力的需求已经爆发式增长。
算力应用也正逐步从互联网向政府、金融、制造等行业拓展,各行各业都将围绕算力进行一次全面升级进化,在互联网外,数字政府、智能金融、智能制造等图景正徐徐展开。
不止大型企业,现在许多中小企业,也希望能借助 AI 这个利器来高效办公降低成本。
不过在旺盛的需求后,当下的算力却极可能面临短缺的难题。
现在想要让 AI 变聪明,要投入的算力成本可谓是指数级狂增。OpenAI 发布的研究报告显示,自 2012 年起,大模型训练所需要的算力每隔 3-4 个月便会翻一倍,整体呈现出指数上涨的趋势。从 2012 年 -2018 年,训练 AIGC 模型所耗费的算力更是增长约 30 万倍 [6]。
据 OpenAI 透露,2019 年在 DOTA 2 比赛中击败世界冠军的 OpenAI Five 训练量达到了800 pfs-day,总训练时间相当于玩了 4.5 万年 Dota,每天的训练量则相当于人类打 180 年游戏 [7]。到 2020 年 6 月,OpenAI 发布的 GPT-3 训练算力已达到 3640 pfs-day [8]。
按这种趋势,我们目前的算力仅仅相当于其中一瓢水,而想要研发出更成熟的人工智能还需要如汪洋大海般多的算力。
此外,AI 对算力的要求也更高了。由于人工智能在训练、验证、部署等阶段往往面临应用场景多元化、数据巨量化带来的诸多挑战,这要求算力在支持大规模部署的同时,要满足高并发、高弹性、高精度等不同计算需求,持续为不同的人工智能负载,高效地提供计算力 [5]。
突破算力瓶颈,要分几步
我们该如何缓解未来的算力饥渴?
不夸张地说,算力堪称数字经济时代的高铁,对于驱动人工智能技术与实体经济融合和高质量发展至关重要。中国信息通信研究院发布的《人工智能核心技术产业白皮书》中预测,到 2030 年,70% 的行业企业都要用到人工智能技术 [9]。
依靠人工智能实现本行业的智能转型,已经是现在各行各业的必修课。而对于城市而言,算力就是未来经济增长的生产力。
各大城市纷纷化身“基建狂魔”,开始不遗余力布局推动算力基础设施的建设,智算中心的建设即是其中的关键环节。据公开资料统计,截至 2023 年 7 月,全国目前已投入运营和在建的人工智能计算中心达 30 余个。
为了突破算力瓶颈,多年来一些 AI 技术领先的头部企业也深耕算力。
比如在城市算力的这场角逐赛中,华为已经在武汉、西安、上海等 25 个城市支持当地政府打造人工智能计算中心,促进地方省市建设算力基础设施。
为进一步突破算力瓶颈,华为主要聚焦在鲲鹏和昇腾的根技术上,通过架构创新、发展生态,以及共建算力等手段,打造强有力的算力底座,支撑中国人工智能产业的发展。
在算力建设中,华为通过架构创新提升了计算效率,例如华为在乌兰察布的数据中心在同等算力的情况下,实现了 10% 以上的效率提升。
在计算产业生态层面,华为坚持通过开源来做强基础软件,特别是面向当前大模型的创新。作为孕育大模型的“梦工厂”,华为提供了全流程的使能平台,让大模型创新批量生产起来,原生孵化了 20 多个基础大模型,同时适配了 10 多个业界主流的大模型。
当前中国大模型中有一半是由昇腾 AI 来支撑的。比如中国商飞上海飞机设计研究院基于昇腾 AI 开发的 “东方.翼风”大模型,获得了 2023 世界人工智能大会最高奖项 — SAIL 奖,这届大会的华为展台也展出了昇腾“大模型超级工厂”展岛。
面向有算力需求的大型企业和中小企业,华为结合实际情况,提供了灵活的模式可供选择决策,让算力不再成为企业发展的瓶颈。
对有自建人工智能算力中心的诉求的大型企业,华为帮助它们构建独立的算力中心。比如华为积极参与了中国移动、科大讯飞、南方电网等企业的算力集群建设。
同时,对于中小企业,华为通过云服务的方式,在华为云上提供人工智能算力服务,让中小企业也可以快速敏捷地开发和应用 AI,降低人工智能的使用门槛。
行业大模型,
为千行百业注入新动力
在算力底座之后,更具针对性的行业大模型是下一个兵家必争之地。
以 ChatGPT 代表的通用大模型的新鲜劲快过去了。年初爆火的 ChatGPT 热度已经迎来了退潮。根据 SimilarWeb 数据,自 2022 年 11 月推出后,ChatGPT 访问量首次陷入下滑,6 月份的全球访问量环比降幅 9.7%,独立访客数量环比下滑了 5.7% [10]。
ChatGPT 离人们的生活似乎还有些距离,不少人只是体验几次,就将 ChatGPT 置之脑后了。摩根士丹利今年 4 月对 2000 人进行调研后发现只有 19% 的受访者使用过 ChatGPT,其中仅 4% 的人表示依赖 ChatGPT [11]。
通用大模型通用性强,但专业性弱。而基于各个行业的数据训练的大模型则结合了各个行业的专有知识和经验,能对特定的问题给出更专业的指导,更适用于具体场景的工作,真正服务好千行百业。
比如在提问政务相关问题时,通用大模型往往会告诉一个通用的办事流程,最后说明各地政策不一样,还需要个人再去了解当地情况,而华为研发的盘古政务大模型学习了超过 20 万条政务数据,能给出更有针对性的办事流程建议。
当在银行取现金没带卡咨询时,通用大模型给出的回答比较像正确的废话,要提供其他证件。
但盘古金融大模型则会给出更适配场景的建议,先解释无卡取现业务,接下来给出具体的指引,用户可以通过手机 APP 进行预约,凭预约手机号、预约码到自动取款机进行无卡取现。
不同于市面上专注语音娱乐互动等的大模型,华为研发的盘古大模型不作诗、只做事。
在 2023 世界人工智能大会上,华为轮值董事长胡厚崑发言中提到人工智能的发展,关键要“走深向实”,赋能产业升级。
当前阶段,华为在人工智能领域有两个着力点。第一,打造强有力的算力底座,支撑中国人工智能产业的发展。其次从通用大模型到行业大模型,让人工智能服务好千行百业,服务好科学研究。
自 2021 年发布以来,盘古大模型一直以 ToB 为主,致力于解决客户运营、产品研发、软件工程、生产供应、市场营销等行业客户所关注的问题。
盘古大模型深耕行业,已经深入金融、制造、政务、电力、煤矿、医疗、铁路等十多个行业,每个行业数据量超过 500 亿 tokens,支撑了 400 多个业务场景的 AI 应用落地。
比如在气象预报领域,盘古气象大模型让风云变幻变得可测。
传统的气象预测资源消耗大且耗时长,如果要预测一个台风未来 10 天的路径,需要在超级计算机花费数小时进行仿真。
而盘古气象大模型学习了 40 多年的全球气象数据,是全球首个精度超过传统预报方式的 AI 模型,可以在秒级时间内完成未来全球一个小时到七天的天气预报,预测速度同比提升 10000 倍。盘古气象大模型的研究成果也已登顶《Nature》正刊。
通用人工智能正在开创下一个黄金十年,在当前阶段,面向未来,华为希望打造强有力的算力底座,来支撑中国人工智能产业的发展,推动人工智能走深向实,真正为各行各业服务、为科学研究服务。
微信扫码关注该文公众号作者