AI芯片的又一种思路
来源:内容由半导体行业观察(ID:icbank)编译自IEEE,谢谢。
人工大脑离我们有多远?也许还有很长的路要走,但大脑网络基本元素突触的工作模拟现在似乎近在咫尺。
这是因为一种从电池中汲取灵感的设备现在似乎非常适合运行人工神经网络。它被称为电化学 RAM (ECRAM),它为传统的基于晶体管的 AI 带来了意想不到的收益——并且在开发完美人工突触的竞赛中迅速走向领先。研究人员最近在本周的 IEEE 国际电子设备会议 ( IEDM 2022 ) 和其他地方报告了一系列进展,包括 ECRAM 设备使用更少的能量,保持内存更长,占用更少的空间。
为当今机器学习算法提供动力的人工神经网络是对大量基于电子的“神经元”及其许多连接或突触进行建模的软件。研究人员认为,不是用软件来表示神经网络,而是用真实设备来表示组件,尤其是突触,从而产生更快、更节能的人工智能。这个称为模拟 AI 的概念需要一个存储单元,该存储单元结合了一系列难以获得的特性:它需要保存足够大范围的模拟值,在不同值之间可靠且快速地切换,长时间保持其值时间,并适合大规模生产。
“这些设备的反应速度比大脑突触快得多。因此,它们让我们有可能进行类似大脑的计算,即人工智能计算,速度明显快于大脑,这正是我们实现人工智能承诺所真正需要的。”——耶稣德尔阿拉莫,麻省理工学院
大多数类型的存储器都非常适合存储数字值,但噪音太大而无法可靠地存储模拟值。但早在 2015 年,由 Alec Talin 领导的桑迪亚国家实验室的一组研究人员就意识到答案就在他们面前:电池的充电状态。“从根本上说,电池通过在两种材料之间移动离子来工作。当离子在两种材料之间移动时,电池会储存和释放能量,”现任密歇根大学材料科学与工程教授的 Yiyang Li 说。“我们发现我们可以使用相同的过程来存储信息。”
换句话说,通道中的离子数量决定了存储的模拟值。理论上,可以检测到单个离子的差异。ECRAM 通过第三个栅极端子控制“电池”中的电荷量来使用这些概念。
想象一个电池,左边是负极,中间是离子掺杂通道,右边是正极。正负端子之间的电导率由通道中的离子数量规定,决定了存储在设备中的模拟值。在通道上方,有一个电解质屏障,允许离子(但不是电子)通过。在屏障的顶部是一个储存层,包含流动离子的供应。施加到该储层的电压用作“门”,迫使离子通过电解质屏障进入通道,或相反。如今,切换到任何所需的存储值所需的时间非常快。
“这些设备的反应速度比大脑突触快得多,”麻省理工学院工程与计算机科学教授 Jesus del Alamo 说。“因此,它们使我们有可能从本质上进行类似大脑的计算,即人工智能计算,速度明显快于大脑,这正是我们实现人工智能承诺所真正需要的。”
最近的发展正在迅速使 ECRAM 更接近于拥有理想模拟存储器所需的所有品质。
低能量
离子不会比单个质子小。麻省理工学院的 Del Alamo 小组选择了这种最小的离子作为他们的信息载体,因为它具有无与伦比的速度。就在几个月前,他们展示了可以在短短纳秒内移动离子的设备,大约是大脑突触速度的 10,000 倍。但速度还不够。
“我们可以看到该设备对 [电压] 脉冲的响应非常快,但仍然有点太大,”del Alamo 说,“这是一个问题。我们还希望能够让设备对电压较低的脉冲做出非常快速的响应,因为这是提高能效的关键。”
在本周 IEEE IEDM 2022 上报告的研究中,麻省理工学院小组通过对电流的首次实时研究深入研究了他们设备的运行细节。他们发现了他们认为是阻止设备在较低电压下切换的瓶颈:质子很容易穿过电解质层,但需要在电解质和通道之间的界面上施加额外的电压。有了这些知识,研究人员相信他们可以设计材料界面以降低切换所需的电压,从而为更高的能源效率和可扩展性打开大门,del Alamo 说。
更长的记忆力
一旦编程,这些设备通常会保持几个小时的电阻率。桑迪亚国家实验室和密歇根大学的研究人员联手将这一保留时间的极限推向了 10 年。他们于 11 月在Advanced Electronic Materials杂志上发表了他们的研究结果。
为了让记忆保持这么久,李益阳领导的团队在麻省理工学院的设备中选择了较重的氧离子,而不是质子。即使使用质量更大的离子,他们观察到的结果也是出乎意料的。“我记得有一天,在我旅行的时候,我的研究生戴安娜·金 (Diana Kim) 向我展示了数据,我大吃一惊,以为做错了什么,”李回忆道。“我们没想到它会如此稳定。后来我们一遍又一遍地重复,直到我们获得足够的信心。”
他们推测非挥发性来自于他们选择的材料,氧化钨,以及氧离子在其中的排列方式。“我们认为这是由于一种叫做相分离的材料特性,它允许离子自行排列,这样就没有驱动力将它们推回去,”李解释道。
不幸的是,这么长的保留时间是以切换速度为代价的,对于 Li 的设备来说,切换速度以分钟为单位。但是,研究人员说,对如何实现保留时间的物理理解使他们能够寻找同时显示出长记忆和更快切换特性的其他材料。
更小的足迹
这些设备上添加的第三个终端使它们比竞争的双终端存储器更笨重,限制了可扩展性。为了帮助缩小设备并将它们有效地组装成阵列,韩国浦项科技大学的研究人员将它们放在一边。这使研究人员能够将设备的占地面积减少到仅 30 x 30 纳米,面积约为前几代产品的五分之一,同时保持开关速度,甚至提高能效和读取时间。他们还在本周的 IEEE IEDM 2022 上报告了他们的结果。
该团队将他们的设备构建为一个大的垂直堆栈:源沉积在底部,接下来是导电通道,然后是其上方的漏极。为了让漏极允许离子进出通道,他们用单层石墨烯代替了通常的半导体材料。这种石墨烯漏极还用作控制离子流的额外屏障。在其上方,他们放置了电解质屏障,最后是离子库和栅极端子。通过这种配置,不仅性能没有降低,而且向设备写入和读取信息所需的能量也减少了。结果,读取状态所需的时间减少了 20 倍。
即使有上述所有进步,加速人工智能训练的商用 ECRAM 芯片仍然有一段距离。IBM Research AI 硬件中心的项目主管 John Rozen 说,这些设备现在可以由铸造友好的材料制成,但这只是故事的一部分。“社区的一个关键重点应该是解决集成问题,使 ECRAM 设备能够与同一晶圆上的前端晶体管逻辑单片耦合,这样我们就可以大规模构建演示器,并确定它是否确实是一项可行的技术。”
IBM 的 Rozen 团队正在努力实现这种可制造性。与此同时,他们创建了一个软件工具,允许用户使用不同的仿真模拟 AI 设备(包括 ECRAM)来实际训练神经网络并评估其性能。
点击文末「阅读原文」,可查看英文链接。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3241内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者