IBM重塑AI计算新方式
来源:内容由半导体行业观察(ID:icbank)综合自网络,谢谢。
IBM 推出了一款用于实现神经网络的模拟内存 IC。该器件将权重作为模拟电平存储在相变存储器中作为电导,并实现模拟乘法累加计算。
我们正处于人工智能革命的开端,这场革命将重新定义我们的生活和工作方式。特别是,深度神经网络 (DNN) 彻底改变了人工智能领域,并随着基础模型和生成式人工智能的出现而日益受到重视。但在传统数字计算架构上运行这些模型限制了它们可实现的性能和能源效率。专门用于人工智能推理的硬件开发已经取得了进展,但其中许多架构在物理上分割了内存和处理单元。这意味着人工智能模型通常存储在离散的内存位置,计算任务需要在内存和处理单元之间不断地整理数据。此过程会减慢计算速度并限制可实现的最大能源效率。
IBM 研究中心一直在研究重塑人工智能计算方式的方法。模拟内存计算,或者简称模拟人工智能,是一种很有前途的方法,可以借用神经网络在生物大脑中运行的关键特征来应对这一挑战。在我们的大脑以及许多其他动物的大脑中,突触的强度(在本例中是“权重”)决定了神经元之间的通信。对于模拟人工智能系统,我们将这些突触权重本地存储在纳米级电阻存储设备的电导值中,例如相变存储器(PCM) 并通过利用电路定律并减少在内存和处理器之间不断发送数据的需要来执行乘法累加 (MAC) 操作,这是 DNN 中的主要计算操作。
对于模拟人工智能处理,“需要克服两个关键挑战:这些存储器阵列需要以与现有数字系统相当的精度进行计算,并且它们需要能够与数字计算单元以及数字通信结构无缝连接”。该组织表示。
据 Biggish Blue 称,该产品经过测试,与数字设备一样擅长计算机视觉人工智能任务,而且能源效率更高。
该芯片是在 IBM 的 Albany NanoTech Complex 中制造的,由 64 个模拟内存计算核心(或块)组成,每个核心包含 256×256 的突触单元格交叉阵列。
IBM 表示,“每个区块还集成了轻量级数字处理单元,执行简单的非线性神经元激活功能和缩放操作”,并且“全局数字处理单元集成在芯片中间,可实现更复杂的关键操作”。用于执行某些类型的神经网络”。
每个图块可以执行与 DNN 模型的一层相关的计算。突触权重被编码为 PCM 设备的模拟电导值。全局数字处理单元集成在芯片中间,可实现更复杂的操作,这些操作对于执行某些类型的神经网络至关重要。该芯片还在所有块和全局数字处理单元的芯片互连处具有数字通信路径。
使用该芯片,我们对模拟内存计算的计算精度进行了最全面的研究,并在CIFAR-10图像数据集上证明了 92.81% 的准确率。我们相信这是目前报道的使用类似技术的芯片中精度最高的。在本文中,我们还展示了如何将模拟内存计算与多个数字处理单元和数字通信结构无缝结合。测得的每个区域的吞吐量为按区域划分的每秒千兆操作 (GOPS) 是描述计算效率的标准指标,其中原始计算操作由伴随的计算区域标准化。它本质上表明给定区域有更多的操作,这意味着该芯片是一个更高效的计算引擎。400 GOPS/mm² 的 8 位输入输出矩阵乘法该芯片的功耗比之前基于电阻式存储器的多核内存计算芯片高出 15 倍以上,同时实现了可比的能源效率。
通过将这种 64 块芯片的面积和能源效率高的模数转换器 (ADC)、高度线性乘法累加计算和强大的数字计算块与我们展示的大规模并行数据传输相结合我们在 2021 年IEEE VLSI 研讨会上推出的 34 块芯片中,现在已经展示了实现快速、低功耗模拟 AI 推理加速器芯片架构愿景所需的许多构建模块。
利用我们的学习成果,我们设计了一个类似的加速器架构,该架构于今年早些时候发布在IEEE Transactions on VLSI systems上。我们的愿景将许多模拟内存计算块与与大规模并行 2D 网格连接的专用数字计算核心相结合。结合我们近年来开发的复杂的硬件感知训练,我们期望这些加速器在未来几年能够在各种模型中提供与软件等效的神经网络精度。
IBM表示:“我们相信这是目前报道的使用类似技术的芯片中精度最高的。”
8bit输入输出矩阵向量乘法密度为400Gop/s/mm²,峰值达到63Top/s和9.76Top/W。
Nature Electronics 将在论文中描述这项工作:“一种基于相变存储器的用于深度神经网络推理的 64 位混合信号内存计算芯片”。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3491期内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者