珠海诞生的GPGPU新势力!清华系芯片老兵创业,首款芯片已量产
▲芯动力GPGPU芯片RPP-R8
推荐一场会议。9月14-15日,2023全球AI芯片峰会将在深圳举行。清华大学魏少军教授领衔近50位演讲嘉宾,NVIDIA与AMD齐聚,15+国产AI芯片企业届时将登台交锋,国内边缘计算AI芯片代表公司亮相。珠海芯动力创始人、CEO李原将在AI芯片架构创新专场,发布主题为《RPP芯片架构给AI芯片带来的发展前景及机遇》的演讲。欢迎扫码报名~
创立芯动力之际,李原早已是一位入局半导体行业19年之久的资深老兵。
▲芯动力发展历程
这一次创业,也让李原对半导体产业的认识更加深刻,他们发现几个特点:
半导体行业产业链绵长,芯片设计公司就是其中的灵魂。
半导体行业全球竞争激烈,中小规模的公司不停被兼并、收购,很多从业人士被迫改行。李原的观点是,不能这样,“我们要逆流而上,要去看一看不同的风景”。
竞争激烈的行业共识后,他们还意识到,一旦在半导体行业里处于领先地位,企业就能获得巨大市场。最后可能形成第一家公司供应产品,第二家公司艰难竞争,第三家公司基本不存在的现象。
因此,第二次创业,李原和团队的目标就是:“我们应该成为一家什么样的公司才有可能存活下来。”
2011年,他们把各种各样不同种类的芯片摆到一张图上,他们发现其中有一个很大的空缺,在常见的CPU、GPU、DSP,以及专用的通信芯片之外,还有一类芯片的位置空缺,未被发现。
在这个空白处画下的大大的问号,成为芯动力创立的起点。经过5年的探索,2016年他们找到了答案——可重构并行处理器架构。基于这一创新架构,李原等人先是在美国成立了公司,2017年转回国内,在珠海创立芯动力公司。
芯动力刚刚成立,李原曾问过朱建斌一个问题:什么样的节点代表他们做的事情成功了?朱建斌的答案是:“我们只要把这颗芯片真的做出来,达到了我们预期的性能指标。”
今年他们迎来了这一时刻。4月,芯动力发布首款基于可重构架构的GPGPU芯片RPP-R8。
RPP-R8每颗芯片内含有1024个计算核,相比传统GPU架构在同样的算力占用更小的芯片面积,实现了低功耗和高能效的有效平衡。RPP-R8除了具备专用芯片所没有的通用编程性,面积效率比可达到同类产品的7~10倍,能效比也超过3倍,可满足高效并行计算及AI计算应用。
▲GPU和RPP架构性能比较
这颗芯片于2020年一次性流片成功,李原透露,RPP-R8目前实现上千片级小规模量产,并且已经进行大规模测试,之后他们会根据客户反馈进行产品修正,再继续下一个产品研发。
事实上,基于RPP架构的芯片成果做出来,在成立时的他们看来是不可能的事情。
这背后的原因可以先从现在的三大GPGPU技术流派来看,第一类较多公司采用的是在比较成熟的GPU架构之上,构建矩阵计算的能力;第二类是纯粹基于可重构技术来做;第三类是将可重构技术与GPU编程模型CUDA语言相结合。
芯动力选择的即是第三类。李原解释说,主要有两大技术原因,首先选择可重构技术是因为,采用传统GPU架构很难追齐行业头部玩家,因此他们需要寻找更好的技术;其次,与CUDA语言相结合是因为其可扩展且广为行业所接受。
走一条全新的路径,也意味着他们一定程度上需要从0开始。李原谈道,最难的地方就在于,不仅要创新,还要达到市场的需求。
RPP架构是针对并行计算设计的芯片架构,芯动力将其称作“六边形战士”。这一架构既结合了NPU的高效率与GPU的高通用性优势,还支持实时操作系统(RTOS),具备DSP的低延时,可满足高效并行计算及AI计算应用,大大提高了系统的实时性和响应速度。
芯动力同样制程下的GPGPU芯片,与英伟达相比,在一些场景下性能提高达50%,且面积为类似芯片的1/7,功耗仅为其1/2-1/3。
这背后离不开芯动力的研发团队,其核心成员有平均年限超过15年的资深半导体从业背景,且均来自英特尔、高通、德州仪器、联发科等半导体知名企业,研发人员占比超过80%。
时至今日,当李原再次问到什么是最大的成功时,朱建斌已经忘记了当初的说法,他的回答变成了:“我们把它在商业上做到成功,我们把这个事情变成一个客户喜欢的商品,这样才是真的成功。”
李原也一直在为做“客户喜欢的商品”而努力。
芯动力GPGPU芯片的第一家客户是一家银行。李原认为,芯片行业周期长,因此芯片设计必须按照产品需求来设计,否则芯片公司拿出的产品很容易因市场需求变化而被淘汰。
因此2017年以后,芯动力团队花了很长一段时间进行市场调研,调研结果与这家银行的需求不谋而合。银行希望将智能摄像头的“智能”和“摄像头”区分开,边缘算力盒子可以独立于摄像头进行升级迭代。
李原谈道,这也是他们与同类企业在市场策略上的不同之处——更加强调对于客户需求的分析。
在这个过程中,他们将客户分为三层,终端用户、软件集成商、硬件集成商。其中,关注设备功能的终端用户目前不在芯动力的合作伙伴之列。
目前,他们采用的策略是,与软件集成商合作先拿到市场,赢得硬件集成商的认同,进一步推广芯片产品。
芯动力的产品已经在边缘计算领域与银行、通讯领域与医疗超声波方向、AI方向的高性能计算等领域实现应用。
作为产业链的上游玩家,芯片行业的封装、模组、软件、芯片本身领域都会影响到相关芯片企业研发或者进入新领域的动作,因此,芯动力目前的策略是把现存的几个方向做扎实,按照节奏来走。
在公司的未来规划中,李原有一个最为清晰的原则,那就是“技术是有边界的”。放到RPP架构中来说,就是这一架构只做适合的并行计算,不会做串行计算。
从任职大厂到自主创业、从半导体老兵到创企CEO,这些此前的工作经历及身份的转变,帮助李原为芯动力一步步确立起了清晰的技术路线和应用方向等。他说,最大的改变是视野不同。创业之前,有限的视野让他产生诸多困惑,例如自己到底在做什么,做的东西有没有用;创业之后,会更关注眼前的困惑,更加重视现在的产品。
针对当前国内GPGPU产业,李原反复提及四个字:竞争激烈。
国内相关创企迎着半导体热潮涌入GPGPU赛道,李原认为,想要在这条赛道活下来,企业必须拿出产品验证自己存在的价值,在某一些方面超过英伟达,做到英伟达做不到的事。
英伟达这个强大的竞争对手,也是国内GPGPU芯片走向落地的最大拦路虎。李原感慨道,最高端,英伟达的A100、H100芯片拥有市场其它芯片无法匹敌的能力;最低端,英伟达的芯片同样在性能、价格上有竞争力。
面对这一劲敌,李原认为,全球竞争激烈的半导体产业中,他们必须超过第一位,成为这个赛道的龙头,才有可能生存下来。想要和英伟达竞争,就要先从与之不同的行业切入。他补充道,英伟达虽然有不同产品,但不见得其产品在每个行业都无可替代。深耕这些行业,使得产品在性能、价格上拥有竞争力是芯动力目前最重要的事情。
此外,当下大模型狂潮席卷,GPU缺货风波不断,也为GPGPU产业带来了很好的机会。在李原看来,主要有两个方向:
首先是AI训练,参数规模庞大的大型语言模型,需要强大的计算能力,国内创企未来的技术演进或许能满足这一需求。不过,目前而言,英伟达在这一方向的领先性鲜少有企业可以与之抗衡。
其次是应用部分,大型语言模型在应用端的计算需求,一般芯片也可以满足,因此这对于国内创企而言是一个巨大的机会。即便大型语言模型距离未来真正落到某一个场景还有一段距离,但李原对这个方向十分乐观,其现在面临的局限性未来有机会被打破。
就芯动力而言,他认为,大型语言模型呈现出的能力和人相比还有一段距离,芯动力会在自己的技术上做一些思考,如何找到创新的芯片架构路径,使得大型语言模型性能达到替代人的地步。
最后,在半导体行业的漫漫创业路中,李原说:“要保持乐观。”他和团队选择了一条艰难的路创业,正因为他们没有在整个半导体行业走下坡路时放弃,现在也幸运地碰到了其中为数不多蓬勃发展的好机会。
在今年9月14日-15日举行的2023全球AI芯片峰会期间,李原将对RPP芯片架构给AI芯片带来的发展前景及机遇进行深入解读,分享这一架构在适配各种不同AI算法和应用场景方面的通用性,以及如何为AI企业提供强大的计算能力,推动AI产品的应用落地。
2023全球AI芯片峰会预告
9月14-15日,大模型与AIGC时代首场AI芯片峰会——2023全球AI芯片峰会(GACS 2023)将在深圳湾万丽酒店举行。目前,清华大学教授、中国半导体行业协会副理事长魏少军领衔45+位嘉宾将带来主题演讲和讨论。
其中,峰会主会场将进行开幕式、AI芯片架构创新专场、AI大算力芯片专场和高能效AI芯片专场;分会场将进行深圳集成电路政策交流会(邀请制)、AI芯片分析师论坛(付费制)和智算中心算力与网络高峰论坛。在主会场和分会场外,同期也开设有小型展区。
微信扫码关注该文公众号作者