Redian新闻
>
220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升

220亿晶体管,IBM机器学习专用处理器NorthPole,能效25倍提升

公众号新闻

机器之心报道

编辑:大盘鸡

IBM 再度发力。


随着 AI 系统的飞速发展,其能源需求也在不断增加。训练新系统需要大量的数据集和处理器时间,因此能耗极高。在某些情况下,执行一些训练好的系统,智能手机就能轻松胜任。但是,执行的次数太多,能耗也会增加。

幸运的是,有很多方法可以降低后者的能耗。IBM 和英特尔已经试验过模仿实际神经元行为设计的处理器。IBM 还测试了在相变存储器中执行神经网络计算,以避免重复访问 RAM。

现在,IBM 又推出了另一种方法。该公司的新型 NorthPole 处理器综合了上述方法的一些理念,并将其与一种非常精简的计算运行方法相结合,从而创造出一种能高效执行基于推理的神经网络的高能效芯片。在图像分类或音频转录等方面,该芯片的效率是 GPU 的 35 倍。

官方博客:https://research.ibm.com/blog/northpole-ibm-ai-chip

NorthPole 的不同之处 

NorthPole 与传统的 AI 处理器不同

首先,NorthPole 对训练神经网络的需求没有任何帮助,它纯粹是为执行而设计的。
其次,它不是通用的 AI 处理器,而是专门为以推理为重点的神经网络设计的。所以,如果你想用它推理、找出图像或音频片段的内容等,那么它就对了。但如果你需要运行一个大型语言模型,这款芯片看起来就没有什么太大用处了。

最后,虽然 NorthPole 借鉴了神经形态计算芯片的一些理念,但它并不是神经形态硬件,因为它的处理单元执行的是计算,而不是模拟实际神经元使用的脉冲通信。

NorthPole 和之前的 TrueNorth 一样,由一个大型计算单元阵列(16×16)组成,每个单元都包含本地内存和代码执行能力。因此,神经网络中各种连接的所有权重都可以准确地存储在需要的地方。

他还有一个特点是广泛的片上网络,至少有四种不同的网络。其中一些网络将已完成计算的信息传送到下一个需要它们的计算单元。其他网络则用于重新配置整个计算单元阵列,在上一层计算仍在进行时,提供执行一层神经网络所需的神经权重和代码。最后,优化相邻计算单元之间的通信。这对于在图像中寻找物体边缘等情况非常有用。如果在输入图像时将相邻像素分配给相邻的计算单元,它们就能更轻松地合作识别出跨越相邻像素的特征。

除此之外,NorthPole 的计算资源也不同寻常。每个单元都经过优化,可执行精度较低的计算,精度从 2 bit 到 8 bit 不等。为了保证这些执行单元的使用,它们不能根据变量值执行条件分支。也就是说,使用者的代码不能包含 if 语句。这种简单的执行方式使每个计算单元都能进行大规模并行执行。在 2 bit 精度下,每个单元可并行执行 8000 多次计算。

配套软件

由于这些独特设计,NorthPole 团队需要开发自己的训练软件,以计算出每一层成功运行所需的最低精度水平。在芯片上执行神经网络也是一个相对不寻常的过程。

一旦神经网络的权重和连接被置于芯片上的缓冲区,执行时只需要一个外部控制器上传它要运行的数据,并告诉它开始运行。其他一切运行都无需中央处理器参与,这也限制了系统级功耗。

NorthPole 测试芯片采用 12 纳米工艺制造,远远落后于前沿技术。尽管如此,他们还是成功地在 220 亿晶体管上安装了 256 个计算单元,每个单元拥有 768 KB 的内存。当该系统与采用类似工艺制造的英伟达 V100 Tensor Core GPU 相比时,可以发现 NorthPole 在相同功耗下的计算能力是后者的 25 倍。

在相同的条件下,NorthPole 的性能比最先进的 GPU 高出约五倍。对该系统的测试表明,它还能高效执行一系列广泛使用的神经网络任务。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
树莓派5来了!算力提升2.5倍,支持PCIe,438元起售!500亿以上晶体管数量的芯片,未来在台积电、三星投片将有难度《中国脊梁》&《九愿》微软一口气发布两款芯片,1050亿晶体管挑战极限450刀BenQ GV1 Smart Portable Projector with Bluetooth Speaker市区River North房源RN01 | 不收中介费/Streeterville & River North 区域树莓派5来了:算力提升2.5倍,支持PCIe,438元起售把冰敲出火MAGUS:机器学习与图论辅助的晶体结构搜索英特尔酷睿 Ultra 第 1 代处理器引入“低功耗能效核”,适用于轻型负载GENOME RES | 北大本科生一作发表论文:基于机器学习的单细胞年龄预测方法微软推出首款自研大模型AI芯片!台积电5nm、1050亿颗晶体管,OpenAI率先试用11月必看!“新世界三大男高音”Juan Diego Flórez首次亮相澳洲!全球首颗用2D半导体做的芯片:1000个晶体管我国自主研发的新一代通用处理器在京发布;谷歌发布首个AI Core应用更新;亚马逊推出AI聊天机器人丨AIGC日报5142 血壮山河之武汉会战 崩溃 2华为已邀请4家智选车合作车企共投合资公司;我国自主研发的新一代通用处理器龙芯3A6000发布丨智能制造日报鹅厂用游戏教海淀学生机器学习?北师大评测:计算思维提升超80%《花信风之处暑》IBM最新推出一款类脑芯片“NorthPole” 用于快速高效的人工智能美股IPO | 阿诺医药 Adlai Nortye,弃港赴美,拟美国IPO上市IPO后,Arm将推出专用处理器浮栅晶体管发明者,施敏博士的半导体人生AI颠覆材料学!DeepMind重磅研究登Nature,预测220万晶体结构赢人类800年热晶体管无需移动部件 即可冷却芯片机器学习泰斗Michael Jordan最新报告:去中心化机器学习中的契约、不确定性和激励马上抢位|《数据科学·机器学习求职实战营》明日开课,全方位提升你的数据分析综合能力!GSR Portfolio∣万有引力完成数亿元A轮融资,用于“XR空间计算”专用芯片的落地2D晶体管的未来展望骁龙8 Gen 3处理器发布:CPU性能提升30%、GPU提升25%向下一代晶体管迈进英国国家机器人实验室王教授:医学成像中机器学习的有效解释性|收获一作论文与导师推荐信!苹果亮出全球首个3nm PC芯片!920亿晶体管,功耗直接砍半?MBP换芯不换面对机器学习感兴趣?不如先来实践一下!|《基于机器学习的智能机器狗巡检系统》不管谁放个打喷嚏,邻居都会感冒
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。