Redian新闻
>
EDA巨头拥抱GPU,用超算助力芯片设计

EDA巨头拥抱GPU,用超算助力芯片设计

公众号新闻

👆如果您希望可以时常见面,欢迎标星🌟收藏哦~

来源:内容由半导体行业观察(ID:icbank)综合自semiwiki和nextplatform,谢谢。

对于 EDA 市场的观察者来说,有一个很容易被忽视的新增长机会。


如今,从数据中心到汽车、航空航天、能源等,大约 50% 的 EDA 收入来自系统而不是半导体公司。在大多数这些行业中,整个系统设计不仅取决于电子设计,还取决于机械和其他多物理场优化(空气动力学、应力、热学、电磁学等)。


多物理场分析(Multiphysics analysis)已经渗透到半导体设计中,例如使用计算流体动力学 (CFD) 进行冷却分析的封装内到系统内热分析和管理。


简而言之,多物理场在电子系统设计和总体系统设计之间架起桥梁,对于支持发电、航空和汽车市场至关重要。与芯片设计一样,这些领域的系统问题变得越来越困难,需要解决方案提供商积极、持续的创新来满足现代设计需求。


Cadence 声称,利用 EDA 和多物理场专业知识之间的协同作用,Millennium 平台为多物理场分析带来了惊人的性能提升,在数小时而不是数周内解决工业规模问题,并开辟了巨大的新增长机会。



Cadence 已有30多年的历史,最出名的可能是其用于设计芯片的电子设计自动化 (EDA) 软件。


几十年来,Cadence 进行了三打以上的收购,以构建其模拟产品组合,涵盖电路、电路板以及模拟和数字电路的系统设计和测试的各个方面。


与此同时,Cadence 一直在升级仿真堆栈,添加了其摄氏度热仿真器,该仿真器混合使用了有限元分析 (FEA:finite element analysis ) 和 CFD(Computational fluid dynamics ),并从那时起构建或购买了其他 CFD 求解器来应对类似问题Ansys正在被 EDA 竞争对手 Synopsis 以 350 亿美元收购。


重要的是,随着多物理场模拟的出现,模拟本身变得越来越复杂,多物理场模拟将设计设备的粒子物理、热力学、电磁和机械特性结合在一起,以创建该设备的更完整的渲染。


CFD 是一个具有悠久历史的高专业领域。工具部门和产品团队通常都配备了大批博士。网格和求解器的算法以及软件已经发生了显著的发展,当然还会继续发展。换句话说,这是 EDA 公司必须无机地进入的领域。


Cadence 于 2021 年在这里进行了一系列收购。其中包括拥有强大网格划分和求解器技术并在船舶和涡轮机械应用领域享有盛誉的 NUMECA。Cadence 收购 Pointwise 后不久,Pointwise 在 CFD 网格划分方面拥有成熟的实力,并在航空航天和国防市场建立了基础。2022 年底,他们收购了 Cascade Technologies,这是一家斯坦福大学的衍生公司,拥有引人注目的 LES 技术。通过这些收购,Cadence 建立了一支稳定的 CFD 纯种技术和专家队伍,增强了他们在多物理场其他方面的既定实力。但他们似乎并没有就此止步。


各行业迫切需要更高的 LES 性能,以实现更准确的数字孪生建模。举个例子,一辆汽车消耗的能量有 50% 用于克服空气动力阻力,直接影响 ICE 燃油消耗或电动汽车续航里程。设计人员需要数字孪生来模拟数千种操作条件,以找到并优化他们可以围绕汽车结构进行的许多小改进,以减少阻力,Cadence 如何满足这一需求?


为了最大限度地减少计算量并调整运行软件的硬件,从而使客户比原本可能更满意,Cadence 实质上是在同一时间进入超级计算机业务和云业务。


Cadence 将由此产生的堆栈称为 Millennium Enterprise Multiphysics Platform,在其上运行的第一代 AI 辅助 CFD 软件称为 M1,它是 Fidelity CFD 套件中大涡流 CFD 模拟器的 GPU 驻留版本。通过两者的结合,Cadence 希望为航空航天、国防、汽车、电子和工业客户提供 CFD 仿真的准确性、速度和规模两个数量级的改进,这些客户的部分业务依赖于 CFD产品、系统或设施设计。Cadence 表示,通过在该仿真软件中使用 GPU 加速器,客户将看到其仿真的能源效率提高了 20 倍。


可以合理地假设其他 Cadence 软件最终将移植到 Millennium 系统,以便 EDA、FEA、CFD 和其他仿真可以作为整体设计的一部分协同工作。


Millennium 平台并不是第一次涉足专门硬件来运行 Cadence 软件。2014年,Cadence创建了一个原型系统,该系统利用其EDA工具的输出来模拟来自Xilinx的大规模FPGA集群上的芯片设计,该系统被称为Protium,该系统在过去十年中已更新和扩展了四次,提高了速度可以编译哪些门以及它可以模拟的设计规模。


2015 年,Cadence 推出了一款更通用的基于 FPGA 的硬件仿真器 Palladium,能够吸收十亿门设计,以 1 MHz 运行它们(不管你相信与否,这相当不错),并编译高级综合以每小时 1 亿门的速度设计 ASIC 直至 FPGA。最新的 Palladium 系统称为 Z2,可以在 10 小时内编译 100 亿个门,或者说速度是原始 Palladium Z1 硬件的 10 倍,并且可以跨越超过 180 亿个门的设计。


Millennium 超级计算机在几个方面有所不同。


首先,它基于具有高速互连的 GPU 加速器的 CPU 主机,就像当今任何其他 AI 和 HPC 超级计算机一样。Cadence 并没有推出任何特定的计算引擎或互连集,也没有透露其参考设计,这些参考设计可能会告诉我们它的选择是什么,因为它不想让自己陷入任何特定的硬件角落。考虑到如今获得 GPU 分配的困难,这是合理的。


也就是说,可以合理地假设 Cadence 选择 Intel Xeon SP 和 AMD Epyc 服务器处理器作为主机,并选择 Nvidia A100 和 H100 以及 AMD Instinct MI250X 和 MI300X 加速器作为 Millennium 系统中的主要计算能力。假设 InfiniBand 是首选互连也是合理的,但以太网对于那些想要走这条路的人来说是一个选择。


硬件很有趣,但 Cadence 表示更重要的是 Fidelity M1 大涡流模拟器的核心求解器(模拟燃烧中的湍流、大气流动、声振动和其他湍流源)驻留在 GPU 中。这意味着 M1 代码完整地在 GPU 上本机运行,并且与许多其他 GPU 加速应用程序不同,M1 代码不会将并行处理片段从 CPU 卸载到 GPU,并将结果带回 CPU 进行其余处理。


“CFD 中的 GPU 计算仍然是相当新的事物,”Cadence CFD 产品管理总监 Alex Gatzemeier 告诉The Next Platform。“我们的大多数客户,基本上是行业中的大多数客户,仍然严重依赖基于 CPU 的 HPC 系统。CFD 的大小和规模与当今 GPU 上的人工智能不同,但获得 GPU 仍然很困难,很难将它们调整为跨云中的十个或二十个节点进行扩展。这仍然是一个挑战。Millennium 提供交钥匙解决方案。因此,没有任何开销,您基本上可以转到云端并在几分钟内开始。或者您可以将 Millennium 运送到您自己的数据中心,您可以根据需要连接任意数量的节点。”


您可能会认为,在大型航空航天公司、大型国防承包商和大型汽车制造商中,他们将拥有数十万甚至数百万个核心来运行 CFD 模拟。但 Gatzemeier 表示,例如,在一家大型汽车制造商中,典型的客户在运行 CFD 的全 CPU 集群中拥有数万个核心,并且典型的作业在几天到一周的时间里在几千个核心上运行。


借助 Millennium 系统,配备 32 个 GPU 的单机架机器每年将提供约 1.5 亿核心小时,大致相当于典型的基于 CPU 的 CFD 集群。而且,由于 Millennium 系统可以跨多个机架进行扩展,如果您确实想更快地完成更多 CFD 工作,甚至可以跨行进行扩展,因此它可以进一步扩展。事实上,多达 5,000 个 GPU 甚至更多。


以下是 Cadence 在橡树岭国家实验室“Summit”超级计算机上运行的早期版本 LES 求解器上展示的一些缩放数据:



右侧的曲线显示了 LES 求解器在不同网格尺度上预测温度的效果。


此图显示了将 GPU 添加到 M1 软件后单个机架内的可扩展性:



Cadence 表示,这个 32 个 GPU 集群在 CFD 代码上的性能与大约 32,000 个 X86 内核相当。这意味着客户现在可以进行更多的 CFD,或者开始进行预测性 CFD 作为设计过程的一部分,并在模型进行风洞测试之前对设计进行更改,从而使设计受益。这就是图表中“左移”的含义,类似于 DevOps 在代码投入资格和生产之前很久就将代码测试转移了。


顺便说一下,Millennium 机器运行的是裸机 Linux,软件根本没有容器化。它的运行方式与任何其他并行 HPC 应用程序一样,无需所有这些爵士乐。但如果你想将 Kubernetes 置于其之上,并在超级计算机上执行不同类型的工作,你也可以做到。


Millennium 超级计算机现已可供订购,Cadence 在圣何塞自己的数据中心托管的云中的部分也是如此。定价没有透露,但我们确实很好奇。


阅读原文

https://www.nextplatform.com/2024/02/01/cadence-sells-custom-gpu-supercomputers-to-run-new-cfd-code/

点这里👆加关注,锁定更多原创内容

END


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3663期内容,欢迎关注。


推荐阅读


EUV光刻机重磅报告,美国发布

碳化硅“狂飙”:追赶、内卷、替代

芯片巨头,都想“干掉”工程师!

苹果,玩转先进封装

GPU的历史性时刻!

大陆集团,开发7nm芯片

张忠谋最新采访:中国会找到反击方法

EUV光刻的新“救星”

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank


喜欢我们的内容就点“在看”分享给小伙伴哦

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
研发光子计算芯片OPU,「光本位」完成近亿天使+轮融资丨早起看早期收获和康复之路AI芯片战局逆转!英伟达欲被放弃,BAT和字节转头拥抱国产?探析异构算力芯片出路在何方?Elon Musk抢购英伟达GPU,也要买AMD芯片GPU,巨变前夜芯片战争早已打响!谷歌15个月打造首个TPU,欲和老黄平起平坐全球零部件巨头拥抱中国创新力量,大陆集团携银基科技共创新标杆dá àn jiē xiǎo 🥳阴差阳错出国门(2)皮衣老黄套路多!被抢破头的 GPU,其实没有任何惊喜GTC 对话黄仁勋:我眼中的 GPU,和别人有很大差别皮衣老黄套路多!被抢破头的GPU,其实没有任何惊喜英伟达新款“中国版”GPU,又一次浮出水面量子计算OpenAI来了?前谷歌3人团队融资1亿元,打造AI算力芯片挑战物理极限2024 年第一大收购案,1100 亿美元「芯片设计巨头」诞生拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM芯片新战场,EDA如何拥抱新挑战?研发光子计算芯片OPU,「光本位」完成近亿天使+轮融资|36氪首发流片 | 芯片设计企业如何降低流片成本,保证芯片顺利量产?战争与爱情咀外文嚼汉字(301)日本人的 “绝活”(4)“离活”太干了,国产芯片设计原厂一览表。。。业界首次!搭载英伟达GPU,50倍性能提升!Zilliz发布Milvus 2.4向量数据库又一款“中国版”GPU,浮出水面AI行业买英伟达GPU,花的钱比赚的多17倍台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!《跌宕起伏心灵煎熬的14天》(4) 【车辆损坏评估与抗争】围剿!美国拟联合盟友禁止维修中国芯片设备龙行龘(dá)龘(dá)!这些三叠字怎么念?原来只是被抱住,人就会掉眼泪|我在北京街头拥抱了100个人英伟达股价又创下历史新高!扎克伯格宣布购买35万GPU芯片,芯片的巨大潜力增长芯片设计迈入“上云”时代英伟达推「万亿参数」GPU,继续加速「AGI 时代」AMD推出锐龙8040系列APU,采用Zen4 CPU+RDNA3 GPU
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。