芯片行业,怎么办?
在战争、气候变化、人口老龄化和供应链中断等严重全球危机的背景下,加上对更好的流动性、可靠的能源、医疗保健的需求,半导体在世界舞台上发挥的作用从未如此重要。在今年的五月imec举办的ITF World会议上,来自全球领先公司的高管也分享了他们对半导体未来发展的观点。
于本文中,我们总结了他们对半导体行业未来几年的主要趋势、挑战和可能的解决方案的见解。
越来越多的数据
使用半导体的驱动因素有很多——云计算、5G、物联网、汽车、移动、AR/VR、手机等——就在去年,还有生成人工智能和 ChatGBT。
人们普遍认为,到 2030 年,半导体市场将达到 1 万亿美元,几乎是目前的两倍。为了实现这一目标,在美国(《CHIPS 法案》)、欧洲、日本、韩国和中国等政府的推动下,数十亿美元的激励措施成立,在去年还宣布了将投资数十亿美元投资新工厂和研究中心。目前正在努力提供所需的劳动力。
图1
了解半导体需求最有用的方法之一是生成的数据量,当然必须收集、分析这些数据并采取行动。“每年产生的数据量呈爆炸式增长,”三星电子设备解决方案业务部的公司总裁兼首席技术官Jaihyuk Song说。““它是太空科学家目前估计的整个宇宙恒星数量的两倍半以上。”
图 1 和图 2 说明了这一趋势。
图2
AMD 执行副总裁和CTO Matk Papermaster 指出,如果我们保持相同的步伐,超级计算机安装所需的电力将接近核电站的电力(图 3)。“这是一个非常可怕的数据点,它真正告诉你的是我们正在达到能源消耗的绝对极限,”他说。
为此,他提出了一个新的解决方案:改变计算方式,让内存更接近CPU,以及新的更节能的芯片设计和架构。“将采取整体方法来弯曲曲线,以便能够提高我们的能源效率,”Pa permaster 说。“我们必须扩大整个堆栈的合作范围和更多的协同设计优化......并真正推动系统级实施。我们必须以不同的方式思考,并真正利用创新。如果你看看我们一直以来的设计方式——专注于孤岛,然后将各个部分组合在一起——这根本无法改变曲线,”他说。
图3
人工智能注定会使问题变得更糟。Papermaster 表示:“人工智能拥有大型语言模型和训练所需的能源,实际上会提高能源消耗的速度和速度。”他指出,今天使用了数十亿个参数来训练 ChatGBT3 等模型,但它现在正在走向数万亿个参数。”
人工智能的爆炸式增长
Imec CEO则Van den Hove 表示,生成式人工智能的快速增长由以下三个主要因素推动:人工智能模型的进步、大量数据的访问以及计算能力的大幅提高。“人工智能的计算需求确实呈爆炸式增长,而我们才刚刚开始,”他说。“为了以可持续的方式产生所需的计算能力,我们将需要性能大幅提高的设备和系统。”
英伟达的黄仁勋也指出,在过去的十年里,深度学习的规模增长了一百万倍。“然后,ChatGPT 出现了……人工智能传遍了世界,”他说。“ChatGPT 是一种生成式预训练 Transformer,是一个大型语言模型,拥有数千亿个参数,经过数万亿个单词和句子的训练。它已经学会了人类语言的表示并可以生成文本。ChatGPT 因其易用性和令人难以置信的功能而具有革命性。这是对理解任何编程语言并执行广泛任务的计算机未来的一瞥。”
黄仁勋进一步指出,已经有超过一千家生成式人工智能初创公司正在发明新的应用程序。例如,Tabnine 是一个上下文代码助手,可以帮助完成代码行或根据提示描述生成整个函数。它可以使用多种流行语言进行编程,从 JavaScript 和 Python 到 Rust、GO 和 BASH。
Runway 使用生成式人工智能来创建和编辑图像和视频。其制作质量令人印象深刻,以至于多部奥斯卡提名电影都使用了它。借助 Runway 的生成式人工智能,任何人都可以通过图片和视频讲述故事。
Insilico Medicine 使用生成式人工智能技术,每次只需三分之一的时间就能创造出一种候选药物,而成本仅为传统方法的十分之一,而传统方法通常需要四年多的时间,成本约为 5 亿美元。Insilico Medicine 被 20 多家制药公司使用。
“感知人工智能的市场影响已经很大,”黄仁勋说。“生成式人工智能的影响将会更大。卓越的易用性使 ChatGPT 在短短几个月内就覆盖了超过 1 亿用户,使其成为历史上增长最快的应用程序。” 他表示,生成式人工智能将能够理解和增强各种形式的信息,“从人类语言、音乐、图片、视频和 3D 到基因、蛋白质和化学物质”。他进一步支持,2 亿个网站上的内容将由人工智能进行个性化和生成,数十亿个客户服务电话将由人工智能实现自动化。生成式人工智能还将帮助 2500 万软件开发人员和数亿创作者。
人工智能的下一波浪潮是什么?在黄仁勋看来,答案是“Embodied AI”,指的是能够理解、推理并与物理世界交互的智能系统。例子包括机器人、自动驾驶汽车,甚至是因为了解物理世界而变得更聪明的聊天机器人。
汽车提出更多的要求
汽车应用是半导体技术的另一个热门驱动因素,包括电动汽车 (EV) 和自动驾驶。除了先进的电池管理系统之外,未来的汽车还需要下一代传感技术,结合多个多光谱摄像头和多个雷达,包括短程和远程雷达。“所有这些传感器都会产生令人难以置信的大量数据,”Van den hove说。“为了处理这个问题,我们的汽车将需要全新的计算架构,在强大的集中式电子控制单元上运行大量人工智能。当从当前的 ADA 系统发展到不断提高的自动驾驶水平时,所需的计算能力呈指数级增长。汽车中的电子控制单元实际上正在迅速发展到曾经的超级计算机性能水平,”他说。
他补充说,虽然汽车中的半导体含量将大幅增加,导致半导体需求不断增长,但全球生产的汽车总数并没有显著增加。“在芯片上设计这些极其昂贵的计算系统并针对高端和低端市场等特定市场以灵活的方式对其进行优化确实并不明显,”他说。“因此,我们需要优化这些计算架构,同时考虑灵活性、复杂性、能源效率和可承受性。”
在这方面引起人们兴趣的一种方法是基于Chiplet的设计,其中设计被分解为更小的硅chiplet,这些chiplet使用先进的异构集成技术融合在一起。“使用chiplet,ECU 可以以更灵活的方式配置,允许高端或低端配置,而无需重新设计整个芯片。由于芯片会更小,它将允许重复使用 IP,它将提供更好的产量和可靠性,这对汽车行业至关重要,”Van den hove 说。
摩尔定律、2D缩放、3D堆叠和
chiplet
几十年来,半导体行业一直享受着摩尔定律所定义的二维缩放的好处。随着这种类型的扩展速度放缓,芯片堆叠和chiplet等替代方法正在发挥作用。“我们相信传统意义上的摩尔定律仍然至关重要。事实上,通过减小单个晶体管的尺寸来进行基于特征的缩放仍然是唯一能够提供真正指数级复杂性增长的技术之一。”Van den hove 说道。
他展示了imec未来十年的路线图(图4),其中包括继续使用2D缩放以及forksheet晶体管和complementary FET (CFET)等新技术。在 CFET 架构中,n 和 pMOS 器件相互堆叠,从而进一步最大化有效沟道宽度。“通过结合基于光刻的缩放和引入新的互连方案、新材料和新器件架构(例如 CFET 器件技术),我们可以实现更多代的持续缩放。”Van den hove 说道。
图4
他还谈到了可能难以逾越的“墙”。电源墙(其中扩展每个晶体管的功耗变得越来越困难)和内存墙(由 CPU 需要来自基于 SRAM 的缓存或 DRAM 的数据的时间与它可以访问数据的时刻之间的延迟定义)。“由于人工智能工作量很大,有效地将数据传入和传出我们的处理器变得越来越困难。
事实上,对于高性能计算机中的特定 AI 工作负载,在某些情况下,处理器仅在不到 3% 的时间内处于活动状态,”他说。“大多数时候他们实际上是在等待数据,因此我们需要重新考虑内存系统架构。”
Imec 还确定了另外三堵墙:
缩放墙:纯光刻技术启用的缩放速度正在减慢。由于微芯片和晶体管的单个结构正在接近原子大小,量子效应开始干扰微芯片的运行,因此这变得越来越困难。
可持续发展墙:半导体器件的制造会增加环境足迹,包括温室气体和水、自然资源和电力消耗。
成本墙:显然,随着复杂性的增加,芯片制造成本以及设计和工艺开发的成本可能会呈爆炸式增长。
Van den hove 表示,该行业将需要广泛的技术选择组合,以实现特定的技术组合,以满足特定的工作负载和系统要求。“内插器芯片和微型硅桥内插器将允许在多个核心处理器chiplet和 3D DRAM 存储器之间实现非常快速的连接,”他说。
Van den hove 表示,该行业将需要广泛的技术选择组合,以实现特定的技术组合,以满足特定的工作负载和系统要求。“Interposer 芯片和tiny silicon bridge interposers将允许在多个核心处理器chiplet和 3D DRAM 存储器之间实现非常快速的连接,”他说。
如今,DRAM 存储器通常构建为 3D 层堆栈,而核心处理器chiplet则使用单个芯片(单片 2D 芯片系统)制造。“实现异构集成的下一个方法是将先进的 2D 处理器芯片构建为 3D 层堆栈,将功能划分为多个层。这可以通过使用先进的晶圆堆叠技术来完成,例如使用硅通孔技术、铜对铜混合键合,从而在逻辑层和内存缓存层之间实现非常高密度的互连,”Van den hove 说。图 5 说明了这在实践中的情况。
图5
“我们相信,这将是比我们认为可能的更进一步扩展摩尔定律的方法之一。我们将此路线图称为 CMOS2.0,通过使用 3D 堆叠实现进一步的 2D 缩放,从而实现摩尔定律的下一阶段。仅 3D 只会给我们带来线性的复杂性增加。”Van den hove 说道。
另一个问题是,先进芯片的功耗不断增加,以至于从芯片中提取热量受到了一些限制。“很明显,为了实现如此复杂的 2D、3D 堆叠核心处理器架构,我们需要解决发热问题并学习如何更有效地冷却芯片。为此,我们正在开发创新的冷却系统,该系统可以使用 3D 打印技术来制造。”Van den hove 说道。这种直接液体射流冲击冷却可实现更高的排热效率,比当前最先进的技术高出五倍。
三星的 Song 指出了与逻辑、DRAM 和 NAND 器件结构特别相关的趋势。在逻辑产品方面,为了解决单元高度缩放的问题,他表示三星正在开发背面互连。“此外,结构和材料方面的创新,例如具有最佳层厚度的沟道材料,与硅沟道相比,可以具有出色的栅极可控性,”他说(见图 6)。
图6
在DRAM中,为了解决横向缩放问题,三星正在研究垂直通道堆叠的3D结构,Song表示这种结构与现有的2D结构有很大不同。“我们还试图引入所有低漏电流沟道材料,而不是迄今为止一直使用的漏电流控制硅沟道,”他说。“为了解决单元电容器问题,我们正在通过研究无电容器 DRAM 的新概念来克服这些限制。”
在NAND方面,多堆栈等技术将继续发展。“需要新材料来克服机械应力或传感裕度。为了进一步缩小单位器件尺寸,需要能够降低工作电压的器件开发新概念。” “为了提高 EUV 的分辨率和均匀性,还需要使用更大镜子的高数值孔径 EUV 技术。”
创新与协作的需要
“为了继续发展数字化转型时代,存储和处理此类大数据的技术需要新时代的发展,而半导体行业需要不断创新才能使这成为可能。” Song说。
AMD 的 Papermaster 指出,就在十年前,深度神经网络开始展现出加速计算的前景。“毫无疑问,我们仍处于最早阶段,”他说。“但我非常充满希望,因为我知道,如果我们采取正确的政策和正确的限制,我们在未来几年将看到这种转变将使我们这个城市变得更加难以置信且富有成效。我们将利用人工智能驱动的计算来加速创新。”
Van den hove 表示,这需要“登月”式的思维。“这需要整个价值链和各大洲之间的协作飞速发展,汇集最优秀的人才。就像六十年代的登月任务一样,我们面临着看似无法克服的挑战。我们必须再次团结一致,建造一艘以创新为燃料的火箭。但现在我们的目标不仅仅是月球,我们的目标是一个更美好的星球,让地球上有更好的生活。”
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3516期内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者