面向RISC-V异构AI芯片的“大编译器”设计和实现 | 演讲预告公众号新闻2024-08-10 06:08生成式AI时代,大模型及AIGC的快速发展推动着计算需求的高速增长。从服务器到边缘,再到AI手机、AI PC、AIoT、智能汽车,各个领域的AI芯片玩家都面临着新的机遇和挑战。AI大模型与各个赛道的结合,带来了新的体验革新,这些新体验的落地则离不开各类AI芯片的支撑。放眼全球,产业格局的激烈变动,也让更多中国AI芯片企业看到了新的发展机会。与此同时,芯片设计的复杂度不断提升、产品快速量产上市的要求不断增加、新兴应用市场不断涌现,投资和成本的压力也水涨船高。AI芯片作为AI产业发展的“基石”,是实现AI产业化落地的核心力量,对AI技术的进步和行业应用都起着决定性作用。如今各路AI芯片创企可谓是百家争鸣,群雄逐鹿成为国内AI芯片产业的主基调。在这样的产业背景下,我们将全球顶级AI芯片产学研用及投融资领域专家们聚集起来,为他们提供思想交锋、观点碰撞的平台。9月6-7日,由芯东西与智猩猩共同发起主办的2024全球AI芯片峰会(GACS 2024)将于北京举办。今年的峰会将以「智算纪元 共筑芯路」为主题,日程为期两天,由一场开幕式、3个主会场专场会议,以及3个分会场论坛组成。3个主会场会议分别是数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场;3个分会场分别是Chiplet关键技术论坛、智算集群技术论坛和中国RISC-V计算芯片创新论坛。峰会同期还将布设展区,展示AI芯片产业链优秀企业的最新技术、产品与方案。同时,峰会期间,还将重磅揭晓两大AIIP AI生产力创新先锋企业榜单,分别是2024年度中国智算集群解决方案企业TOP 20、2024年度中国AI芯片新锐企业TOP 10。目前,兆松科技联合创始人兼CTO伍华林已确定出席,将在峰会第二日下午的分会场中国RISC-V计算芯片创新论坛带来演讲,主题为《面向RISC-V异构AI芯片的“大编译器”设计和实现》。 嘉宾介绍伍华林,兆松科技联合创始人兼CTO,曾就职于Andes、S3、Imagination编译器部门,参与和负责CPU、GPU、GPGPU芯片的编译器等设计和研发,拥有十多年编译器行业从业经验。于2019年和前Andes软件部门VP王东华一起创办兆松科技。 演讲概要如何快速适配各类AI框架,支持各类模型高效的运行,以及让用户轻松编写高性能的算子库,成为一款AI芯片能否得到市场认可的必要条件。同时,进一步降低AI芯片的软件栈研发成本和算子库维护成本,提升硬件利用率,也成为AI芯片公司走向盈利的必经之路。兆松科技为解决AI芯片软件栈和算子库的性能和维护等难题,提出了“大编译器”的概念。传统编译器只针对某一特定指令集的芯片产生单线程或者多线程的可执行文件,兆松科技基于MLIR框架设计的“大编译器”,支持PyTorch, Tensorflow, ONNX, JAX导入,结合Triton和Mojo(未来支持)等类Python语言编写的高层次算子库,在统一的MLIR多层中间方言实现全局的图优化以及更优的算子融合策略,从而进一步提升AI芯片的效率。同时,“大编译器”还对平台相关的runtime进行了平台无关的抽象,从而实现从控制器代码自动生成、AI加速器代码自动生成、控制器和AI加速器数据搬运代码自动生成的功能;并且因为只需要维护一套和平台无关的高层次算子库(平台相关的内容自动由编译器产生),让算子库的维护变得更加简单。兆松科技设计的这套“大编译器”在第一阶段支持基于RISC-V架构的AI芯片(包括数据流芯片),未来会逐步扩展支持非RISC-V架构的AI芯片。本次演讲主要分享兆松科技是如何通过“大编译器”来解决AI模型到异构系统端到端高效适配的问题峰会日程及嘉宾 报名方式峰会设有四类电子门票,分别为免费票、免审票、通票和贵宾票。其中,免费票,申请后需经主办方审核通过方可参会,免审票、通票和贵宾票均需购买。大家可以扫描下方二维码,添加小助手“雪梨”即可进行免费票申请,或购买电子门票。已添加过“雪梨”的老朋友,给“雪梨”私信,发送“GACS24”即可。微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章