Redian新闻
>
清华光电计算新突破:芯片性能提升万倍,研究登顶Nature

清华光电计算新突破:芯片性能提升万倍,研究登顶Nature

公众号新闻

机器之心专栏

机器之心编辑部

清华大学团队在超高性能计算芯片领域取得新突破,相关研究发表在Nature上。

随着各类大模型和深度神经网络的涌现,如何制造出满足人工智能发展、兼具大算力和高能效的下一代 AI 芯片,已成为国际前沿热点。

中国科协发布的 2023 重大科学问题中「如何实现低能耗人工智能」 被排在首位。

近日,清华大学团队在高性能计算芯片领域取得新突破。相关成果以《面向高速视觉任务的纯模拟光电计算芯片》(All-analog photo-electronic chip for high-speed vision tasks)为题发表在 Nature 上。

这枚芯片基于纯模拟光电融合计算架构,在包括 ImageNet 等智能视觉任务实测中,相同准确率下,比现有高性能 GPU 算力提升三千倍,能效提升四百万倍

图1 相关论文(来源:《Nature》)


论文地址:

Chen, Y. et al. All-analog photoelectronic chip for high-speed vision tasks. Nature https://doi.org/10.1038/s41586-023-06558-8 (2023).


未来已来?光为载体的计算芯片

实现算力飞跃并非易事,特别是当前传统的芯片架构,受限于电子晶体管大小逼近物理极限。全新计算架构成为破局的关键。光计算以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。

光计算,顾名思义是将计算载体从电变为光,利用光在芯片中的传播进行计算。面对以光速计算的诱人前景,数年来海内外知名科研团队相继提出多种设计,但要替代现有电子器件实现系统级应用,仍面临重大瓶颈

  • 一是如何在一枚芯片上集成大规模的计算单元(可控神经元),且约束误差累计程度;
  • 二是实现高速高效的片上非线性;
  • 三是为兼容目前以电子信号为主体的信息社会,如何提供光计算与电子信号计算的高效接口。当前常见的模数转换功耗,较光计算每步乘加运算高出多个数量级,掩盖了光计算本身的性能优势,导致光芯片难以在实际应用中体现出优越性。

系统级算力和能效,超现有芯片万倍

为解决这一国际难题,清华大学团队创造性地提出了模拟电融合模拟光的计算框架,构建可见光下的大规模多层衍射神经网络实现视觉特征提取,利用光电流直接进行基于基尔霍夫定律的纯模拟电子计算,两者集成在同一枚芯片框架内,完成了 “传感前 + 传感中 + 近传感” 的新型计算系统。极大地降低了对于高精度 ADC 的需求,消除传统计算机视觉处理范式在模数转换过程中速度、精度与功耗相互制约的物理瓶颈,在一枚芯片上突破大规模集成、高效非线性、高速光电接口三个关键瓶颈。

图 2. 光电计算芯片 ACCEL 的计算原理和芯片架构(来源:《Nature》)

实测表现下,ACCEL 芯片的系统级算力达到现有高性能芯片的数千倍。同时系统级能效达 74.8 Peta-OPS/W,较现有的高性能 GPU、TPU、光计算和模拟电计算架构,提升了两千到数百万倍

在超低功耗下运行的 ACCEL 将有助于大幅度改善发热问题,对于芯片的未来设计带来全方位突破,并为超高速物理观测提供算力基础。同时对无人系统、自动驾驶等续航能力要求高的场景带来重大利好。

表 1. ACCEL 和现有高性能芯片的系统级实测性能指标对比(来源:《Nature》)

非相干光直接计算

更进一步,ACCEL 芯片还支持非相干光视觉场景的直接计算,如论文中演示的交通场景实验。显著拓展了 ACCEL 的应用领域,有望颠覆目前自动驾驶、机器人视觉、移动设备等领域先将图片拍摄并保存在内存中后进行计算的思路,避免传输和 ADC 带宽限制,在传感过程中完成计算。

图 3. ACCEL 可用于电子设备超低功耗人脸唤醒示意动图(来源:清华大学)

开辟新路径:颠覆性架构有望真正落地

清华团队提出的新型计算架构不仅对于光计算技术的应用部署意义重大,对未来其他高效能计算技术与当前电子信息系统的融合,亦深有启发。

论文通讯作者之一,清华大学戴琼海院士介绍道,“采用全新原理研发出计算系统是一座大山,而将新一代计算架构真正落地到现实生活,解决国计民生的重大需求,是攀过高峰后更重要的攻关。”

Nature 杂志特邀在 Research Briefing 发表的该研究专题评述也指出,“或许这项工作的出现,会让新一代计算架构,比预想中早得多地进入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.)”。

清华大学戴琼海院士、方璐副教授、乔飞副研究员、吴嘉敏助理教授为本文的共同通讯作者;博士生陈一彤、博士生麦麦提・那扎买提、许晗博士为共同一作;孟瑶博士、周天贶助理研究员、博士生李广普、范静涛研究员、魏琦副研究员共同参与了这项研究。




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
百岁老人研究新突破:C反应蛋白、中性粒细胞与淋巴细胞比率与中国百岁老人的长期死亡率相关10倍性能提升-SLS Prometheus 时序存储技术演进亚马逊年终王炸!两大自研AI芯片性能飙升,推AI助手硬杠微软,联手老黄造最强超算算力提升三千余倍!我国芯片领域实现新突破网络规模、训练学习速度提升,清华团队在大规模光电智能计算方向取得进展清华芯片新突破登Science,获评“存算一体领域重大进展”!基于类脑架构实现片上快速AI学习美国西北角小家庭和单身人士购物最爱的一家连锁超市Python 3.12 正式发布:性能提升、no-GIL将在 3.13 提供骁龙8 Gen 3处理器发布:CPU性能提升30%、GPU提升25%Nature BME | 双管齐下增强疫苗效果,华人学者引领mRNA技术新突破Nature突破:刘光慧等发现维生素C可延缓灵长类脊髓运动神经衰老囤 H100 的都成了大冤种!英伟达发布最新 AI 芯片 H200:性能提升 2 倍,成本下降 50%中科加禾崔慧敏:AI芯片+编译器才是王道!性能提升2~3倍,将推出大模型推理引擎丨GACS 2023刚刚,苹果发布Mac重磅新品!搭载M3芯片性能爆炸,最大彩蛋居然是 iPhone…和致远 破浪行|秦叔逵教授:呋喹替尼获美国FDA/欧洲EMA双双受理,FRESCO-2研究登顶《柳叶刀》厚重的历史书,雄伟的大教堂量子计算突破:IBM推出新型模块化系统,瞄准2033年超级计算机英伟达最强芯片性能公布,比H100高17%比流计算资源效率最高提升 1000 倍,“增量计算”新模式能否颠覆数据分析?视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效Nature重磅突破:华人学者首次证实,改变心肌细胞能量代谢,可实现心脏再生亚马逊年终王炸!两大自研AI芯片性能飙升,推AI助手硬刚微软,联手老黄造最强超算SpaceX推迟发射搭载23颗“星链”卫星的“猎鹰9号”火箭;清华开发超高速光电计算芯片丨智能制造日报麒麟软件虚拟 GPU 方案 V2.0 发布,3D 渲染性能提升至 80% 以上AI颠覆材料学!DeepMind重磅研究登Nature,预测220万晶体结构赢人类800年战国故事《定风波》卷二(25):春梦“九章三号”来了!速度提升一百万倍,再创世界纪录囤H100的都成了大冤种!英伟达发布最新AI芯片H200:性能提升2倍,成本下降50%红色日记 1967年 18岁 1.1-16史上最短发布会,苹果扔出王炸!M3芯片性能遥遥领先回忆与思考百纳米完胜7纳米?清华团队在该芯片领域实现新突破,芯片性能提升万倍将Python程序移植到Mojo,性能提升250倍、速度比C版本快20%清华光刻机很难懂?我们让大模型翻译了一下 |【经纬低调出品】苹果最新芯片性能评测,超乎想象
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。