在信息化进程下,海量数据爆炸式增长,造成前所未有的数据挑战:算不及、存不下、运不走。邬江兴院士曾总结当前芯片产业发展面临的“三堵墙”。第一堵墙是物理极限,工艺节点进步逐渐逼近1nm物理极限;第二堵墙是良率极限,单芯片尺寸越做越大,但良率控制越来越难,合格率显著下滑;第三堵墙是封装极限,先进封装技术遭遇散热或规模瓶颈,功耗问题日益凸显,难以支持大规模Die的高级封装。一方面,登纳德缩放定律失效,摩尔定律放缓,令制程工艺进步对单芯片计算性能的贡献比例不再显著;另一方面,从芯片、模组、机匣、机架到系统,逐层堆叠的工程技术路线面临性能、功耗、时延、可靠性等多方面的发展瓶颈。我们做个简单推演:芯粒从晶圆被切出来,被封装到模组,多个模组拼成板卡,多个板卡组成机架,众多机架再组成分散到不同机房的集群,随着通信范围扩大,连接越来越稀疏,每过一级传输都会对带宽施加限制,有效的算力、存储力、网络通信力层层折损,能效越来越低。也就是说,原本芯片能发挥出十成的功力,按照现有的“堆砌式”工程技术路线去走,等到系统层面,它的功力已经折损到只剩下一成。这就好比建设现代摩天大楼,如果用一块砖头一抹水泥的老办法来堆砌,这栋楼越往上盖承重压力越大,而且根本扛不住地震暴风;要让大楼足够坚固稳定,必须根据超高层建筑结构的受力特点,来设计作为大楼中心支撑的整体钢架。同样,大型信息基础设施亦是一个复杂精密的系统级工程,要减少从芯片到系统的“逐级插损”,需从计算体系结构层面进行全维创新。针对这些问题,邬江兴院士带领团队提出了软件定义晶上系统(SDSoW,Software Defined System on Wafer),将大型信息基础设施的工程技术路线从“逐层堆叠式”演进为由异质材料、不同制程工艺的各种芯粒异构集成的“拼接组装式”。打个比方,“逐层堆叠式”路线像从乡、县到市再到省,一级一级地管理指挥;而“拼接组装式”路线通过将所有芯粒集中放在一块大晶圆上,实现了无插损的扁平化指挥。据邬江兴院士团队与寒武纪联合测算,基于SDSoW技术路线,在28nm工艺条件下,仅用16块晶圆,就能构建与美国超算Summit同等的算力,同时功耗仅为其1/80、占地面积为其1/16,造价仅为1/5;84块晶圆即可构建E级机器,功耗仅有“堆砌式”系统的1/15、占地面积为其1/18、造价仅为其1/3。这样对比来看,SDSoW能够将整个大型信息基础设施的综合效益显著提升,对于短期内破解“卡脖子”难题、中长期提供换道超车新路径具有双重战略意义。即便先进工艺及工具受阻,SDSoW也能基于自主可控的国产技术及装备资源,达到领先的系统性能水平。这一技术路线究竟是怎么实现的?最新技术与生态进展如何?如何助力解决国产芯片自主化的痛点?近日,芯东西与邬江兴院士团队核心成员进行深入交流。 02.结构创新×工艺创新将异构异质芯粒灵活集成