Redian新闻
>
12家AI芯片创企,盯上大模型生意

12家AI芯片创企,盯上大模型生意

科技

瞄准AI大模型芯片,这12家创企凭什么?
作者 |  ZeR0
编辑 |  漠影
芯东西1月10日报道,谈起生成式AI热潮的受益者,没有人能忽略英伟达。据The Information统计,目前北美地区至少有12家AI芯片创企想从英伟达独享的生成式AI算力红利中分一杯羹。

▲12家AI芯片瞄准大模型(芯东西根据The Information表格编译整理)

这些创企创办时间不超过8年,其中有5家都是2022年创办的,有4家创始成员有谷歌背景。累计融资金额最高的Cerebras,早已凭晶圆级芯片声名鹊起;成立相对较晚的5家创企,创始成员背景也各有千秋。
总的来看,这12家盯上生成式AI算力蛋糕的北美AI芯片创企,有的定位做训练,有的主攻推理,有些则更进一步,将其产品定位瞄准特定类型的AI模型,如多数大模型的基础Transformer。
这是一个高风险的游戏:这些关键选择将决定初创公司是生存还是失败。
推理一直是更受欢迎的选择。因为很多客户使用或微调已经被训练过的模型,而不是从头开始构建一个新模型。而高推理成本正对包括OpenAI在内的大模型及生成式AI公司们产生压力。
d-MatrixEtched.aiExtropicSiMa.ai、Groq正在构建专门用于某些模型架构的芯片,如为OpenAI和Anthropic的大语言模型提供动力的Transformer。这些公司认为,专用芯片比英伟达、Cerebras、Lightmatter、Rain AI、Tenstorrent等的通用芯片更快、效率更高。
但芯片研发充满挑战与未知。这些创企的多数产品最早要到今年年底才会上市销售。到那时,Transformer可能已经是旧新闻了。一些开发人员已经在测试像Mamba这样的新模型架构。
1、Cerebras
Cerebras成立于2016年。其核心产品是第二代晶圆级引擎WSE-2,将85万个核心打包到一个处理器上,并采用40GB超快片上SRAM和比传统集群快几个数量级的互联技术。Cerebras官网将WSE-2称作是“地球上最快的AI芯片”。

Cerebras的创始成员中,CEO Andrew Feldman与CTO Gary Lauterbach曾分别是高带宽微服务器先驱SeaMicro的CEO和CTO,首席架构师Michael James曾任SeaMicro首席软件架构师。SeaMicro在2012年被AMD收购。

多位OpenAI联合创始人、Stripe前CTO、AMD前CTO兼总裁、Cadence前CEO等业界大佬都在其投资方阵容中。

2、Lightmatter
Lightmatter成立于2017年,创始团队来自麻省理工学院。其研发的Envise光电混合计算芯片能够满足训练大语言模型等任务的计算要求,并减少数据中心功耗与成本。

2023年11月,Lightmatter宣布获得1.55亿美元融资,投资方包括谷歌风投等,这笔融资是其5月份C轮融资的延续。至此,Lightmatter累计融资额超过4.2亿美元,估值达12亿美元。

3、Tenstorrent
Tenstorrent成立于2016年,由AMD前嵌入式工程师Ivan Hamer、AMD前集成电路设计总监Ljubisa Bajic和AMD前固件设计工程师Milos Trajkovic创办。
硅谷顶级芯片架构师Jim Keller担任Tenstorrent CEO。该公司累计融资额达3.85亿美元,投资者包括三星、现代等,估值大约达到10亿美元,跻身独角兽企业之列。

这家AI芯片创企利用RISC-V和Chiplet技术打造可扩展、高能效的AI芯片,目前有两款机器学习处理器Grayskull和Black Hole,其更先进的3nm AI芯片Grendel预计今年推出。
4、Groq
Groq成立于2016年年底,由多位前谷歌TPU开发团队成员创办。他们基于软件定义硬件的思路,设计了一个张量流处理器TSP架构,旨在实现高性能、低延迟的AI加速。

这家创企主要研发云端AI推理芯片,累计融资额达到3.67亿美元。去年Groq LPU加速器在Meta Llama 2 70B大语言模型上实现了每秒生成超过280个token的推理性能。
5、SiMa.ai
SiMa.ai成立于2018年。创始人兼CEO Krishna Rangasayee曾在全球最大FPGA芯片供应商赛灵思工作了近20年。
这家创企在2019年推出首款AI芯片组MLSoC,主要面向计算机视觉领域的推理计算。2023年6月,SiMa.ai称其第一代边缘AI芯片已开始量产,正与制造、汽车、航空等行业的50多家客户合作。

6、d-Matrix
d-Matrix成立于2019年,主要研发存内计算AI芯片。官网宣称构建了“世界上最高效的大规模AI推理平台”,跑Llama 2 13B大语言模型的大规模推理速度“倍杀”H100和A100。

其最新数字存内计算芯片Jayhawk II采用台积电6nm制程和Chiplet D2D互连方案,可为生成式AI应用推理任务提供支撑。
该创企融资金额超过1.6亿美元,投资方包括微软、SK海力士等。微软承诺今年将对其芯片进行自用评估。d-Matrix预计两年内收入将达到7000万~7500万美元区间,并实现收支平衡。

7、Modular AI
Modular AI是这12家创企中唯一一家专注于软件的公司,成立于2022年,致力于构建出模块化、可组合和分层架构的AI基础设施,包括打造编译器、运行时环境等,开发出CUDA替代品。

这家创企在2023年8月获得1亿美元融资,投资方包括谷歌风投。其CEO是LLVM之父Chris Lattner,曾在苹果公司领导Swift编程语言的开发,后来与Modular首席产品官Tim Davis一起在谷歌工作,负责监督AI产品开发。
2023年5月,Modular AI首次举办发布会,推出高效推理引擎和Mojo编程语言。其高效推理引擎可轻松将主流深度学习框架上的模型快速部署到服务器或边缘设备上。Mojo编程语言无需C++和CUDA运行环境,即可直接将类似Python语言的代码高效部署到芯片上运行。

8、Rain AI
Rain AI成立于2017年,旨在解决使用传统GPU训练和运行机器学习的高成本问题。OpenAI CEO Sam Altman、百度风投都投资了这家公司。

其AI芯片设计理念受大脑启发。早在2018年,Altman就看好Rain走得类脑芯片路线,以个人名义向Rain AI领投了一笔种子轮融资。第二年,OpenAI签署一项不具有约束力的协议,计划等Rain AI的芯片上市后斥资5100万美元采购这些芯片,不过至今尚未采取后续措施。
Rain AI在2021年推出可训练的端到端模拟AI芯片的工作原型芯片,近期的AI芯片产品则采用数字存内计算技术。截至目前,其累计融资金额约为4000万美元。

9、MatX
MatX成立于2022年,专注于面向大语言模型开发更快的专用芯片,旨在设计出通用人工智能(AGI)的计算平台,比英伟达GPU等硬件更快、更省钱的芯片。
其CEO Reiner Pope参与构建谷歌PaLM模型,曾写出谷歌最快的推理软件;CTO Mike Gunter曾参与谷歌TPU工作。

根据官网信息,MatX已获得一些风投机构以及领先的大语言模型和AI研究人员的支持,但并未公布产品或融资额。

10、Etched.ai
Etched.ai成立于2022年10月,两位创始人CEO Gavin Uberti和CTO Chris Zhu均在本科期间从哈佛休学,想要研发一款能加速大语言模型的AI芯片“Sohu”。

通过在硬件层面集成Transformer架构、配备144GB HBM3e显存,Sohu芯片的推理性能将达到英伟达H100的10倍,单位价格将获得140倍于H100的吞吐量性能。该芯片预计今年交付。

2023年6月,Etched.ai宣布获得536万美元种子轮融资,投资方包括包括Ebay前CEO Devin Wenig。融资后其估值达到3400万美元。
11、Extropic
2023年的最后一个月,AI芯片创企Extropic宣布获得1410万美元天使轮融资。这家创企成立于2022年,创始成员CEO Guillaume Verdon和CTO Trevor McCourt来自谷歌量子AI团队。Guillaume 被认为是量子深度学习领域的先驱。

Extropic自称正在为物理世界中的生成式AI构建终极基础,利用热力学和信息的第一原理构建人工智能超级计算机。
目前,Extropic正在研发一款能运行大语言模型的AI芯片。其芯片的核心部件是一种叫做热力学逻辑门的微型装置,利用了热力学系统的能量转换和信息处理功能把热能等能量转化为算力。
12、Tiny Corp
Tiny Corp成立于2022年5月,其创始人兼CEO是业界知名黑客“神奇小子”George Hotz,他也是自动驾驶创企Comma AI的创始人。2023年5月,Tiny Corp获得510万美元融资。
George Hotz认为,创办AI芯片公司的唯一途径就是从软件开始,这家创业公司想要帮助开发人员加快训练和运行机器学习模型的过程。其首个项目是为AMD芯片构建框架、运行时和驱动程序,短期目标是使用tinygrad框架让AMD支持MLPerf。





微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
忐忑回国行 (一)2家被否,42家撤回!2023年北交所IPO终止企业情况分析“平价貂”,盯上年轻人免费《大模型应用实践》实训营第二周课程来啦!这次百度算法工程师团队手把手教你构建大模型应用,另有第一周干货回顾!GPU大芯片创业的点球大战GPT又迎重磅升级!万物皆可大模型(赠大模型系列课程+书籍)免费学Al大模型公开课,送Al大模型资料包(限时免费)AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug国内各大语言模型生成的“关于公众号华尔街俱乐部”的内容苹果 iOS 史上最大更新!Siri 要上大模型了【动脉严选新品鉴第37期】百度灵医大模型:国内首个产业级医疗大模型字节版GPTs今日上线;小爱同学通过大模型备案;多家AI创企为生存求收购丨AIGC大事日报打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训犹太理工男教授和大陆理工男教授强强联合!芯华章携手芯擎科技,软硬协同加速车规级芯片创新大模型infra专场:大模型系统层工作 | 第16届中国R会议暨2023X-AGI大会消息称创企Stability AI正寻求出售;斯坦福博士创立的AI创企Pika推出首款视频生成产品丨AIGC日报苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布一路走来(三十八)清华90后博导创业,人形机器人用上大模型,成立5个月融资超亿元OpenAI百度争相送钱,盯上一家AI芯片创企强强联合,百度智能云牵手荣耀,启动大模型生态全面战略合作爱彼迎收购Siri创始人之一联合创立的AI创企;IBM宣布AI模型管理平台将于12月初全面上市丨AIGC日报传字节成立AI应用新部门Flow;淘天集团筹建大模型团队;浪潮信息开源千亿级大模型丨AIGC大事日报月薪5000的年轻人,盯上低价医美团千元成本搞定专业大模型,系统优化+开源大模型是关键 | 潞晨卞正达@MEET2024红色日记 董老逝世 4.1-15惊人:用AI大模型生成一张图,相当于给一部手机充满电英国游玩:令人恼火的“车事儿”!摩尔精英CEO张竞扬:芯片创业进入效率时代,从“做大做快”到“做好做强”大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!中国已经有238个大模型了?李彦宏劝各位少做点大模型多搞搞应用吧2023创业家年会关键词是“AI”;百度发布Q3财报;拼多多成立大模型团队;字节飞书接入大模型;比尔·盖茨最新分享
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。