抢跑智驾AI芯片「新路径」
“胆量”这个词,被后摩智能创始人兼CEO吴强着重提及。
5月10日,后摩智能发布首款存算一体智驾芯片鸿途™H30,以12nm制程实现最高物理算力 256TOPS,典型功耗 35W,成为国内率先落地存算一体大算力 AI 芯片的公司。即,能效比大幅拉升至7.3TOPS/W,根据高工智能汽车之前系统梳理,业内智驾大算力芯片采用冯诺依曼架构,能效比多在2-4TOPS/W。
事实上,自1945年6月,冯·诺依曼写出那份著名的长达101页的文档《First Draft of a Report on the EDVAC》,详细阐述“存储程序计算机(Stored-program Computer)”,不久后第一台冯·诺依曼架构计算机诞生,截至目前70多年间,主流的计算范式始终遵循这一架构。
根据资深芯片专家陈巍博士、耿云川博士此前文章阐述,冯式架构以计算为核心,计算与存储分离,两者配合完成数据的存取和计算,处理器以提升计算速度为主,存储注重容量提升和成本优化。但在过去20年,处理器性能以每年大约55%的速度提升,内存性能的提升速度每年只有10%左右,存储速度严重滞后于处理器的计算速度。
详细来看,自动驾驶、元宇宙、大模型等强烈呼唤更大算力、更高能效时代。但,冯式架构下,由于存储器和处理器的数据交换通路窄,AI运算需1PB/s,但DRAM 为40GB-1TB/s,数据提取、搬运时间为运算时间的成百上千倍,无用功耗约为60-90%,即存储墙、带宽墙、功耗墙问题越来越严重。
存算一体的概念提出于1969年,为非冯氏架构,其直接利用存储器进行数据处理或计算,从而把数据存储与计算融合在同一个芯片的同一片区之中,可以彻底消除冯氏架构架构瓶颈,“数量级程度降低功耗、一定程度提升算力(计算能力仍受制程制约)”。
受限于芯片制造技术和算力需求的匮乏,存算一体一段时间内仅仅停留在理论研究阶段,近年来则再次在产业界走热,英伟达、英特尔、微软等纷纷推出系统原型。
吴强瞄准的,就是这样一个时代窗口。
“长远来看,我们想做的事情就是用一个极致效率的芯片去实现万物智能,这也是我们自己给自己的使命”,吴强在发布会上称,从早期计算机到PC时代,再到智能手机时代,都伴随着1000倍计算效率的提升。后摩智能显然欲借底层技术创新的存算一体,抢跑下一个时代。
在第一阶段,后摩智能聚焦的应用领域为智能驾驶。
底层技术和处理器架构层面,据后摩智能联合创始人兼研发副总裁陈亮介绍,存算IP层面,鸿途™H30基于 SRAM 存储介质,采用数字存算一体,拥有极低访存功耗和超高计算密度,在 Int8 数据精度条件下,其AI核心IPU能效比高达15Tops/W,是传统架构芯片的7 倍以上。
处理器架构层面,后摩智能规划了三代架构,第一代为天枢架构,面向智能驾驶打造;第二代为天璇架构(已在研发中),可根据应用场景的不同配置计算单元的数量,整体性能、效率和灵活性将进一步跃升,支持多场景应用,例如成本和功耗敏感的智能终端、自动驾驶、大模型等场景;第三代IPU面向通用人工智能打造,命名为天玑架构。
其中,鸿途™H30基于天枢架构,其采用多核、多硬件线程的方式扩展算力,实现了计算效率与算力灵活扩展的均衡,AI 计算可以在核内完成端到端处理,保证通用性。得益于此,鸿途™H30 实现了性能2倍提升的同时,降低50%功耗。
“它最大的特点就是计算效率特别高”,后摩智能联合创始人兼产品副总裁信晓旭称。
据信晓旭介绍,SOC层面,得益于存算一体底层架构创新优势,鸿途™H30 基于 12nm 工艺制程实现256TOPS物理算力,SoC能效比达到 7.3Tops/W,具有高计算效率、低计算延时、低工艺依赖等特点。
鸿途™H30 已成功运行常用的经典 CV 网络和多种自动驾驶先进网络,包括BEV 网络模型以及广泛应用于高阶辅助驾驶领域的 Pointpillar 网络模型,以鸿途™H30 打造的智能驾驶解决方案已经在合作伙伴的无人小车上完成部署。
据信晓旭释放的信息,鸿途™H30 将于2023年6月份开始给 Alpha 客户送测。同时,后摩智能的第二代产品鸿途™H50 已经在全力研发中,将于2024年推出,支持客户2025年的量产车型。
那么,鸿途™H30 瞄准具体什么样的市场?
根据高工智能此前调研获取的信息,当前智驾芯片呈分层发展趋势,其一,智能前视一体机;其二,5-20TOPS轻量级行泊一体;其三,50-200TOPS中算力平台,支撑增强版高速NOA;其四,200TOPS以上高算力平台,做硬件预置和算力冗余,传感器配激光雷达,支撑城市NOA。
显然,鸿途™H30更有可能面向第四个市场,这也意味着,其将英伟达的Orin形成正面对抗。整体来看,这一市场在2022年已开启规模放量元年,与城市NOA元年、激光雷达规模放量元年相对应。对此,信晓旭也强调,产品发布只是开始,接下来的落地中,后摩会针对不同车型和对成本的考量,推出更丰富的产品系列,以满足不同类型客户对性价比的需求。
在时间节奏上,虽然后摩智能未披露鸿途™H30的量产时间,不过根据送测到上车的时间周期,鸿途™H30最快或于2024年上车。
根据后摩智能披露的信息,“我们拜访了超过50家客户和合作伙伴(包括20+主机厂),与他们进行了多轮次的合作和交流,我们也一起探讨如何用存算一体的颠覆性的技术,解决现实方案中的痛点,让我们的产品定义和产品组合策略更清晰”。
值得一提的是,为助力客户产品落地,后摩智能基于鸿途™H30开发了硬件参考设计平台:力驭®智驾域控制器。
根据现场展示的信息,该平台功耗仅85W,以太接口方面,提供8路100/1000Base-T1、2路100/1000Base-TX接口,可接入激光雷达、TBOX、组合导航及调试,摄像头接口方面,提供12路GMSL2摄像头接口,支持raw data输入(支持2个800万摄像头、6个200万摄像头)。
欲戴皇冠,必承其重。
高工智能汽车注意到,一方面,作为智驾芯片初创企业,此前调研中,部分业内人士反馈的最大挑战为“完成商业化闭环”。换言之,没有厂商可以在一开始,就交出一个十全十美的“芯片+工具链”,只有抓住某一具体应用场景的市场窗口,先交一个相对优质的答卷,被客户用起来,有一定造血能力,接着再快速把芯片、工具链迭代好。
另一方面,根据业内的观点,存算一体从学术研究,走向产业落地,面临的挑战包括:电路设计影响芯片算效提升、芯片架构场景通用性及规模扩展能力较差、EDA工具链尚未健全、软件及算法生态不完善等。
后摩智能如何解决?
根据信晓旭的介绍,在商业模式上,“后摩智能会坚定把自己定位为汽车产业连的Tier2,我们坚持不跨界、不越位原则,要做好自己擅长的事,我们坚持会用我们的底层的核心技术,去打造有竞争力的智能驾驶计算芯片,并提供必要的组件”。
同时,后摩智能尝试搭打造Sailing平台(寓意助力合作伙伴扬帆起航)。
其包括三部分:其一,贴近芯片的使能组件部分,包括基于鸿途™系列芯片的硬件平台、Boot&Drivers、软件工具链后摩大道™;其二,包括第三方合作伙伴的底层OS、第三方合作伙伴的中间件、第三方合作伙伴的智驾算法;其三,提供Model zoo加快合作伙伴的算法开发进程。
软件工具链为核心关键之一。根据高工智能汽车此前调研获取的信息,芯片厂商的长期核心竞争力往往被聚焦为两个:芯片本身、主要包括工具链的生态。此次发布会上,信晓旭亦分享了其创业之前过往从业过程中的“教训”:因工具链难用导致已获得的项目被客户放弃。
“我们的竞争力要构建两个方面:一个是要基于存算一体架构打造更好的PPA,这是硬的东西;另外一个是软的东西,我们要把软件工具链当成产品的另外一个关键的竞争力来打造”,信晓旭称,这是公司团队在创业伊始就达成的共识。
据介绍,后摩大道™的设计哲学包括两个:大道至简、大道至臻。
前者强调相同:对于客户呈现的开发方式、用户使用习惯,保持不变或者是相近的,尽量降低算法开发者的学习成本;后者强调不同,“为了打造好用的工具链,我们做了很多底层的独特设计。工具链和底层架构是强相关的,好用的工具链需要底层硬件给予很好的支持”。
整体来看,后摩大道™支持 PyTorch、TensorFlow 、ONNX 等主流开源框架,编程兼容 CUDA 前端语法,同时支持 SIMD 和 SIMT 两种编程模型,兼顾运行效率和开发效率,以无侵入式的底层架构创新保障了通用性的同时,进一步实现了鸿途™H30 的高效、易用。
微信扫码关注该文公众号作者