高性能计算的次世代,要移平三座大山公众号新闻2022-10-27 01:10“不要低估未来十年的变化,高性能计算都要装在四个轮子上跑了。”“我们总是高估未来2年会发生的改变,低估了未来10年将发生的变化。”比尔盖茨这句名言用到如今的高性能计算(HPC)领域再贴切不过。十年前,谁能想到高性能计算能够让普通人在智能手机上就能点外卖,电影大片的特效渲染也需要高性能计算的加持。十年前,几乎没有人能料想到英伟达和高通在2022年发布的智能汽车芯片AI算力能高达2000T,未来的智能汽车将是“装了四个轮子的超级计算机”。高性能计算的应用早已不再局限于天气预测、药物研发、油田分析等少数应用,如今的高性能计算正在进入次世代,应用的领域不仅更加广泛,与普通人的生活联系的也更加紧密。新思科技研究团队早在几年前就预测,高性能计算和云将会被用于多种不同类型的应用中,无论大小。在AI、元宇宙、智能汽车等诸多技术和应用的推动下,面对越来越大的芯片和越来越复杂系统,高性能计算的计算、存储、网络挑战应该如何解决?01十年变革,高性能计算正在进入次世代最近几年,高性能计算受到越来越多的关注。新冠疫情下,高性能计算对于疫苗和药物的研发发挥了重要的作用。越来越智能的汽车也依赖算力的大幅度提升。还有近两年备受关注的元宇宙,也需要高性能计算作为支撑。而这些大大小小的应用,也正是推动高性能计算进入下一个时代的动力。知名市场分析机构Mordor Intelligence在2021年的一份报告中指出,高性能计算市场在2020年到2025年预计将以每年6%以上的速度增长。高性能计算的主要作用其实就是为数据中心的运行提供所需的计算能力。过去,数据中心处理的数据只是某个特定组织业务运营的输出,通过对由人机交互生成的大量数据进行测量、推理或分析实现更高商业价值,比如药物研发和油田分析。如今,数据不再由人类实践所生成,比如,一辆自动驾驶汽车每行驶1小时可以生成5TB的数据,随着自动驾驶汽车数量的增多,产生的数据量也将十分惊人。研究型数据统计公司Statista预计,2010年全球的数据量为2ZB,这一数据在2025年将增长至181ZB,数据正在以超乎想象的速度增长。数据生成方式发生根本性转变的同时,数据处理和存储技术近十年间也发正了变革。这进一步引发了数据中心架构的重大变化,分布式网络应运而生。CPU已经不能满足数据爆炸式增长带来的计算需求,需要性能更强的专用处理器。同时,新的数据中心架构对于通信性能的要求也大幅提升,独立网卡(NIC)和服务器机架上的架顶式交换机的性能和延迟,对于在数据中心内部高效移动数据而言也不再适用。数据爆发对于存储技术和容量带来的挑战,也需要创新性技术满足云计算和高性能计算的需求。IDC预测,从2020年到2025年,全球存储容量将以每年19.2%的速度增长。新的应用确实在推动高性能计算进入次世代,但在摩尔定律放缓的背景下,高性能计算无论是提升计算性能,还是降低通信延迟和实现存储技术创新,都面临着诸多挑战。02追求高性能,先破复杂性挑战过去几十年间,得益于摩尔定律,芯片的性能持续快速提升。然而,先进的制程正在接近物理极限,这一方面让依靠先进制程提升单芯片性能的难度和复杂度越来越高。另一方面,想要将小芯片集成到单个系统中也带来了复杂性和设计的挑战。这就意味着,无论采用何种方式提升计算性能,都同样面临着更高复杂度的设计挑战。先看提升单芯片性能面临的挑战,单芯片性能的提升正在将裸片尺寸推向制造工艺的极限,这就不仅要克服单芯片设计规模的挑战,还面临整体成本增加的问题。3DIC Complier是一个不错的解决方案,它可以将设计分解为多个集成芯片设计。要使用3DIC Complier设计性能强大的芯片,从一开始,开发者就需要使用新思科技的3DIC Compiler 等工具进行更多的早期版图规划和基于封装的信号完整性分析。3DIC Compiler是统一的多裸晶芯片设计实现平台,不仅效率高,还能扩展容量和性能,为各种异构工艺和堆叠裸片提供无缝支持。新思科技已经与台积电紧密合作,无缝集成了基于台积公司3DFabric技术的设计方法, 为客户提供完整的“初步规划到签核”的设计平台,能够满足芯片开发者对性能、功耗和晶体管数量密度的要求。为应对不断增长的单芯片设计规模的挑战,开发者则需要使用像新思科技的Fusion Design Platform,这一平台能让芯片开发者在不断增加的计算内核上进行操作,并且这些工具能在云环境中使用。在云环境中,开发者可以访问成千上万的计算资源,这对提升芯片的整体性能以及加快上市时间有重要意义。今年,新思科技也和三星达成合作,通过Fusion Design Platform提供经认证的数字实现、时序和物理签核参考流程,开发者可以利用新思科技平台的自动化功能和集成优势来提高工作效率,并在三星的先进工艺节点上最大限度地提高PPA,还能加速高性能计算芯片的设计。Arm也已利用新思科技的Fusion Design Platform和Verification Continuum Platform,实现了Neoverse V1和N2云端到边缘基础设施内核的快速开发和理想PPA指标,加快了高性能计算和AI应用领域中基于Arm的产品上市时间。提升单芯片性能的设计难度,以及先进制程带来的高成本都是大部分芯片设计公司难以承受的。从系统的角度看,下一代高性能计算架构将出现分解架构和异构系统的爆炸式增长,不同的专用处理架构将集成在单个节点中,在模块之间实现精密、灵活的切换。于是,将不同性能和功能的芯片封装在一起的小芯片技术受到欢迎,Die-to-Die接口对于不受封装成本和装配限制的高性能计算应用SoC非常有吸引力。小芯片的设计可以根据应用需求集成各种小芯片和IP资源,但即使是较大的公司也负担不起所有IP的开发费用,采购第三方IP可以节省时间和金钱,是更理想的选择。作为全球顶级的IP提供商,新思科技提供一系列Die-to-Die IP,包括UCIe和基于SerDes的PHY和控制器。一边提升单芯片的性能,一边通过小芯片的设计不断提升性能,高性能计算在解决计算挑战的同时,还需解决网络和存储的挑战。03HPC是全面硬实力的考验用于大数据处理、模拟和预测的模型越来越复杂,推动了对更高计算能力和更大存储容量,以及更低网络延迟的需求,这是一个全面硬实力的考验。据估算,数据中心的运行和冷却服务器的用电各占约40%,20%的用电用于存储和网络。只有同时解决新型数据中心计算、存储和网络的挑战,才能迈入高性能计算的新时代,实现数据中心的碳中和。高性能计算要实现性能提升,就要求数据网络和设备接口需要增加带宽满足计算和存储节点间的数据传输需求。这给高性能计算的存储系统带来了包括带宽、容量、延迟、安全性、访问管理、功率等诸多挑战。十年前,人们对于带宽需求的估计很低,大概是现在的一半甚至三分之一。但如今,全球对带宽的需求以前所未有的速度增长,以太网正在成为数据中心高性能计算的选择。以太网、PCIe和其它接口技术都在逐渐增加带宽以满足需求,以太网正在从100Gbps过渡到800Gbps。虽然访问支持10Gbps到800Gbps以太网的各种配置的IP很重要,但SoC开发者也在寻找能够提供更多差异化的解决方案,比如可根据特定设计需求进行配置的最低延迟以太网IP;能够缩短上市时间的集成MAC、PCS和PHY的解决方案等。作为业界为数不多能够提供高性能计算端到端解决方案的公司,新思科技也有高质量的IP解决方案帮助开发者应对网络挑战。新思科技全面的112G以太网PHY解决方案结合了自身的布线可行性研究、封装基板指南、信号和电源完整性模型以及深入的串扰分析,可实现快速可靠的SoC集成。112G以太网PHY是新思科技面向高性能计算应用的综合IP产品组合的一部分,除此之外还包括广泛使用的协议如PCI Express 、DDR、HBM、Die-to-Die、CXL和 CCIX。网络性能的提升的同时,存储设备上的数据接口速度也在提高,NVMe SSD采用PCIe 5.0和6.0,传输速率可以达到32Gbps和64Gbps。与提升产品性能一样重要的,是对芯片全生命周期的追踪,特别是高性能计算这样对芯片品质、安全性和可靠性要求极高的应用。生命周期管理(SLM)的出现,让设备运作的一整个生命周期都可持续提供资料反馈和优化,帮助开发者设计出更优秀芯片。SLM很可能会改变整个先进工艺设计领域的游戏规则,新思科技也将发挥重要作用。得益于在TEST和DFT领域丰富的经验和强大的实力,新思科技建立了SLM平台,并且,新思科技还将SLM平台与领先的EDA和IP技术相整合,建构了完整的一体化平台,帮助芯片设计团队最大化芯片的PPA,加速产品上市。另外,一些额外的存储技术也能满足次世代高性能计算的需求。比如持久内存技术、远程直接内存访问(RDMA)和RoCE、NVMe-oF、计算存储。新思科技与业界一起解决高性能计算的存储挑战,提供广泛的高性能IP产品组合,例如DDR、HBM、以太网和PCIe PHY和控制器、ARC处理器以及设计工具。一个很好的例子是,Socionext采用了新思科技的HBM2E IP,运行速度为3.6Gbps的HBM2E IP,满足了Socionext创新AI引擎和加速器片上系统(SoC)对于容量、功耗和计算性能的严苛要求,成功将5nm工艺HBM2E IP部署于AI和高性能计算SoC。04端到端解决方案是进入高性能计算次世代关键人们常说,科技改变生活。芯片作为技术革命底层的支撑,一直在影响着科技未来的走向。随着高性能计算的持续发展,以及高性能计算更加广泛的应用,我们将迎来更加智能的生活,体验到云计算带来的数字化普及带来的便利,智能汽车带来的全新体验,以及元宇宙的全新世界。这一切的背后,新思科技高性能计算端到端的全面解决方案,以及高效、安全的IP和工具,更是支撑高性能计算进入新时代的关键。点击阅读原文,查看高性能计算和数据中心解决方案//近期热门文章留给快手海外业务的时间不多了扫地机器人「退潮」:内卷、降价、裁员离开去哪儿的日子微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章