达摩院2023十大科技趋势发布:人类对通用AI的想象从未如此具体
杨净 发自 凹非寺
量子位 | 公众号 QbitAI
刚刚,达摩院十大科技趋势榜单发布。
本次包含了AI、芯片、云计算等基础技术领域,既有引发全球投资浪潮的生成式AI,也有在规模化应用前夜的存算一体、Chiplet设计封装技术……
(先来一睹为快)
但跟以往不同的是,仅从榜单上可以看到,产业、融合等成为此次的关键词。
而在跟达摩院进一步交谈之中,这背后还有更深次的底层逻辑的不同。
达摩院怎么看科技趋势?
延续以往惯例,本次趋势榜单拆分成了三个维度:范式重置、产业革新、场景变换。
如前所述技术维度上看,包括了像AI、芯片、云计算等基础性技术。
AI:多模态预训练大模型、生成式AI;
芯片:Chiplet、存算一体;
云计算:云原生安全、软硬融合云计算体系架构、端网融合的可预期网络。
以及在此基础上各种交叉技术融合,催生出来的新场景、新应用,比如双引擎智能决策、计算光学成像、大规模城市数字孪生。
而从产业的维度,则是聚焦于ICT(Information and Communications Technology)领域,既包括了计算(存储)和通信(网络)两大底层技术,也横向包括了安全(管理)、应用(行业)两大应用领域。
跟以往相比,今年达摩院给出的科技趋势有着不容忽略的关键词,那就是融合。这也是在与达摩院交谈中,谈及最多的趋势。
有计算与通信的融合、硬件与软件的融合、数字技术与产业融合……这其中最显性、呈现出应用大爆发盛况,是AI技术与行业之间的融合。
在这方面,达摩院今年重点看向了有望重置范式的多模态预训练大模型,以及激发更多场景的生成式AI。
多模态预训练大模型
AI正从文本、语音、视觉等单模态智能,朝着多种模态融合的通用AI方向发展,这一点在过去一年已被广泛感知了。
典型进展包括OpenAI提出的图像文本匹配模型CLIP。以爆火的Stable DIffusion为代表的AI绘画领域, 背后基本上都是围绕着CLIP展开。
还有在“所有事情上打败所有人”的微软多模态基础模型BEiT-3。该模型仅靠19亿参数,只用公共数据集,在12个任务上狂刷SOTA,甚至还包括了纯视觉任务。
基于过去一年蓬勃式发展,已经可以预见到,一方面,对个人而言,可以激发创造能力,尤其是非技术人员,也无需具备编程能力。另一方面,多模态预训练模型将重塑人工智能商业模式。
具备大数据、算力资源和模型开发能力的科技企业,将成为模型服务的提供方,帮助企业将基础模型的能力和生产流程融合起来,进而实现降本增效。
阿里认为,建立统一的、跨场景、多任务的多模态基础模型会成为AI发展主流趋势之一。
未来大模型作为基础设施,将实现图像、文本、音频统一知识表示,并朝着能推理、能回答问题、能总结、做创作的认知智能方向演进。
生成式AI
如果说多模态预训练大模型是未来AI基础设施,那么生成式AI则是技术底座之上的场景革新,涵盖了图文创作、代码生成、游戏、广告、艺术平面设计等应用。
过去一年,有关技术上的进展主要包括三个方面。
图像生成:以DALL-E 2、Stable Diffusion为代表的扩散模型;
NLP(自然语言处理):基于GPT-3.5的ChatGPT;
代码生成:基于CodeX的Copilot。
随着内容创造的爆发式增长,内容质量和语义的可控是当前所面临的挑战。在产业化方面,还有降成本、数据的安全可控、创作版权等问题需要解决。
未来,生成式AI将成为一项大众化的基础技术,将极大推动数字化内容的生产和创造,其应用边界也将拓展到更多领域。
可以看到的是,以多模态预训练大模型、生成式AI为代表的AI技术已经来到规模化前夜、爆发前的奇点。
一方面,人类对通用人工智能的想象已经开始具象;另一方面,这也是达摩院十大科技趋势显露出的一大特点。
那就是关注技术突破带来的产业趋势。
同样的趋势也出现在了榜单其他技术上面,他们都已证明产业价值,等待市场验证。
比如去年刚成立联盟的Chiplet芯片封装技术,其互联标准将逐渐统一,可能将重构芯片研发流程;还有摩尔定律突围下的存算一体芯片,在资本和产业双轮驱动下,它将在垂直细分领域迎来规模化商用。
不过在前沿科技协同并进、百舸争流的当下,这些趋势的存在倒也并不稀奇。但毕竟是对未来的预测,达摩院为何只选择这些趋势作为未来值得关注的风向?
这就要提及把本次的方法论,这也是跟以往更底层不同所在。
为什么这么看?
在本次趋势报告以及在与达摩院的交流中谈及方法论本质——
Back to Basic,从基础的领域出发洞察产业变化。
前面也已经介绍,本次比以往更聚焦——集中于ICT领域的计算(存储)、通信(网络)、安全(管理)、应用(行业)等四大领域进行分析。
在延续以往的“定量发散、定性收敛”分析方法之下综合考量的因素也发生了细微变化。
本次主要是基于理论关注度、技术可行性、产业化程度、社会价值等因素。
从理论到技术,再到产业化、市场验证社会价值,这恰好是前沿科技从科学理论,最终走向市场,带来普惠价值的基本路径。
而过去,以去年趋势榜单为例,他们评选维度更关注技术可行性、社会价值、理论关注度等因素。
在浮于表面的现象之下,达摩院十大科技趋势组委会成员秦钖讲到了一个关键问题:
一些非常好的科学理论能不能形成技术,需要经过三个重大关口考验。
第一个考验是技术本身,有没有量级提升,会带来什么样的作用;第二个关口是产业,能不能形成完整上下游的产业生态,能不能工程化、产品化;第三个则是市场检验,能不能被消费者所接受?有没有人替技术买单。
上世纪90年代,唐纳德·司托克斯在《基础科学与技术创新:巴斯德象限》中,将科技从理论研究到应用落地,分成了四个象限,分别是波尔象限、巴斯德象限、爱迪生象限以及皮特森象限。
其中以巴斯德象限为中心的研究思路,才是实现从理论到使用技术的路径方式。
这也正是本次达摩院十大科技趋势研究的切入点,更具体来说,是即将受到市场验证,有望形成产业生态的主流趋势。
基于这样的思路,本次研究中他们也透露,不得不对许多技术趋势进行取舍,比如在安全方面,没有选择在过去同样引发热议的量子加密、可信隐私计算等,最终选择了云原生安全。
不少专家在调研中反映,网络安全虽然是个随动技术,但是很多的技术是后发先至的。
比如如果没有密码技术提前应对“后量子时代”,去回应量子计算,那么将来很多问题都会同一时间爆发出来。
然而,综合领域在过去一年底层技术是否发生了明显的进步,以及整个产业领域是否小众等因素,组委会最终做了严格筛选。
为何值得关注?
最后,回到科技趋势本身,每年提供预测的机构不胜枚举,为何达摩院给出的榜单值得关注?
首先,具有前瞻性,是每年科技发展的风向标。今年已是达摩院第五次发布趋势榜单,在此之前就已经成功预测了AI for Science、大模型、AI制药等诸多领域。
尤其是去年预测的AI for Science,可以看到过去这段时间,AI for Science技术成果集中爆发,在生物医药、材料、物理、化学、甚至数学上发挥出越来越重要的作用。
其次,还兼具专业性,从每年的评选流程可以看到,达摩院十大趋势诞生过程中会先对论文和专利的大数据“定量发散”,再对产、学、研、用领域近百位专家深度访谈“定性收敛”, 从科学家、企业家和工程师的访谈中交叉验证。
参与到此次调研访谈的中国工程院院士邬贺铨表示,达摩院的十大科技趋势报告会对整个ICT行业,包括对技术创新和ICT在垂直行业的应用研究起到很好的借鉴作用。
最后,单从此次回归产业本质的角度来看,前沿科学与产业技术的融合远比以往更加紧密。这恰好也是当下机器革命的外化。
如果时间阵线拉长,事实上每一次工业革命,都与两种之间的融合关系有关。
达摩院十大科技趋势项目组成员秦钖曾这样举例:从产业角度来看,第一次工业革命,科学与技术还相对较远;第二次的工业革命,技术与科学之间开始紧密,科学开始在慢慢指导技术;到第三次信息革命则更为明显。
如果说第二次工业革命它的范式标准是规模化跟标准化的话,到第三次工业革命,就是个性化和规模化的统一。
毫无疑问的是,我们正处于一个全新的技术周期。与产业全方位、深层次地融合成为题中之义。
新的一年有什么样的技术趋势值得关注,达摩院给了份答案。
— 完 —
点这里👇关注我,记得标星哦~
微信扫码关注该文公众号作者