Redian新闻
>
打造分布式AI开发和部署平台,「潞晨科技」完成数亿元A轮融资|36氪首发

打造分布式AI开发和部署平台,「潞晨科技」完成数亿元A轮融资|36氪首发

公众号新闻


优化大模型算力,大幅降低落地成本。


真梓
封面来源IC photo

36氪获悉,潞晨科技宣布完成数亿元的A轮融资。据公司介绍,本轮融资是潞晨科技成立18个月内完成的第三轮融资,此次融资资金将主要用于团队扩张和业务拓展。

众所周知,如今生成式AI的“涌现”能力来自于底层大模型的成熟,但训练大模型需要的算力、网络、数据成本非寻常公司能承受。而本文主角潞晨科技,希望为这一难题提供解法。

潞晨科技成立于2021年,主要业务是通过打造分布式AI开发和部署平台,帮助企业降低大模型的落地成本,提升训练、推理效率。公司创始人尤洋告诉36氪,自己此前在伯克利、新加坡国立大学均从事分布式计算、机器学习、高性能计算相关研究,曾创造ImageNet以及BERT训练速度的世界纪录。而在2021年左右,他更加笃信大模型的趋势,所以在当年创立潞晨科技,希望降低大模型的落地门槛。

潞晨科技当前的产品包括开源高效深度学习系统Colossal-AI和对应的企业版PaaS平台。平台主要由异构内存管理系统、高效N维并行系统、低延时推理系统组成,整体希望帮客户达成最小化模型部署成本、最大化计算效率的效果。

针对内存管理,尤洋对36氪表示,模型参数、层数越大,计算量相应也越大。GPT3的1750亿参数,可能需要占据800G内存。再加上训练神经网络时还需要存梯度、优化器状态,“GPT3在什么都没干的情况下,就要消耗3200G内存。”尤洋举例。再加上内存资源其实较为稀缺,所以科学管理内存资源在训练大模型的场景下变得异常重要。当GPU内存放不下这些数据,还需要把部分数据迁移到CPU、NVMe硬盘上。

尤洋表示,管理GPU、CPU、NVMe硬盘被称为异构管理。过去,异构管理主要延续静态思路,一开始就预估好参数、梯度、优化器等所需的资源。在尤洋看来,这种方式由于比较固化,没办法随着实际训练过程调配,很可能存在浪费资源。但潞晨采取的动态管理方式,可以更加灵活的平衡资源,“我们希望数据都能放到GPU里。但是如果GPU放不下了就放CPU里,CPU放不下就放NVMe里,但同时我们需要最小化CPU、GPU、NVMe之间的数据移动,这是最重要的。”尤洋表示,潞晨的异构内存管理系统可以帮助达成这一目标。

另一方面,企业如今训练大模型,常基于成百上千张GPU卡完成。这是因为,理论上,卡越多需要的训练时间越少,大模型的落地也更具效率。但实际情况中,卡越多意味着承载计算功能的机器越多,而在最终汇总各机器结果时,通信又会造成新的效率损耗。

针对这一痛点,潞晨打造了高效N维并行系统。尤洋表示,在这一系统中公司采用了高维张量并行等方式提升效率。尤洋表示,这背后的原理主要是用二维的方式设计张量并行。张量并行可以让计算任务被分解后同步进行。二维切片的方式,则让每个机器只需要和同行或者同列的机器打交道,不需要和所有机器打交道。“假如我们要1万个机器计算、传统方法(一维)一个机器需要跟9999个剩下机器打交道,我们只需要和99个机器打交道就可以。”他说。

第三是低延时推理系统,作用是减少模型推理速度慢带来的延时感。尤洋表示,解决这一问题,整体的部署方式和模型本身的优化都很重要。在优化方面,潞晨的内存管理、张量并行技术,以及剪枝蒸馏等方案均能发挥作用。

可以看出,异构内存管理系统、高效N维并行系统主要在训练步骤中发挥效力,低延时推理系统则提升推理部分的速度。若再细分,异构内存管理系统更能帮助客户节省资源成本,高效N维并行系统更能提升计算速度。尤洋表示,目前这三大系统均汇聚在公司的PaaS平台中,开源版本Colossal-AI目前也已获得约3万颗GitHub星星。在具体服务方式上,尤洋表示,目前客户可以通过潞晨的PaaS平台直接训练自己的模型,潞晨也可以帮助客户训练模型。据介绍,目前潞晨的方案已在自动驾驶、云计算、零售、医药、芯片、金融等行业落地。

Colossal-AI GitHub星数

在2023年的整体规划上,尤洋告诉36氪,今年以来公司的业务量随着各行业客户的模型训练需求激增,预计收入整体相比去年会增长3-5倍。据了解,本轮融资后潞晨将加速扩张,并希望吸引招募更多的MLOps、AI大模型、AI框架等领域优秀人才加入,以更好服务客户。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
专注光电转换材料的自主研发,「绿人科技」获数千万元A轮融资|36氪首发「句子互动」完成数百万美元Pre-A轮融资,打造大模型驱动的下一代对话式营销云|36氪首发头部司库玩家再度进击,「司库立方」完成数亿元C轮融资|36氪首发为医院提供智慧运营管理分析平台,「华宁世纪」获1800万元首轮融资|36氪首发专注先进工业传感器,「宁波新算」完成Pre A轮融资|36氪首发对标「Retool」,低代码开发平台「码匠」完成数百万美元天使轮融资|36氪首发推出SCA、SAST软件供应链安全产品线,「安势信息」完成Pre-A+轮融资|36氪首发提供认知决策智能解决方案,「渊亭科技」完成亿元级别B+轮融资|36氪首发基于人体微生态大数据切入新药研发和健康消费,「零一生命」完成亿元B1轮融资|36氪首发「游乐加PLAY+」完成数千万元种子轮融资,在核心商圈打造沉浸式潮玩文旅乐园|36氪首发给宠物搭建专属「智能舱」,「小宠科技」完成近千万元天使轮融资|36氪首发鲜榨果汁气泡水打入餐饮渠道,「好飒」完成数千万元天使轮融资|36氪首发自主研发和生产「中国心」,人工心脏企业「核心医疗」获近2亿元C+轮融资|36氪首发冷却的不止季节(41)— 丧葬费「运满满冷运」完成数亿元B轮融资,平台冷藏车注册量达27万|36氪首发将AI分类分级能力融入数据底座中,「霍因科技」完成数千万元A轮融资|36氪首发遥思龙泉桃花宴高蛋白全营养「面食」上架全国盒马,「MOODLES魔斗仕」完成Pre A+轮融资|36氪首发「快控科技」完成Pre-A轮融资,推进智能汽车中间件和以太网零件量产交付|36氪首发「沐创集成电路」完成数亿元A2轮融资,网络芯片和安全芯片已形成系列产品|36氪首发研发本体感知AI解决方案,「咸兑科技」完成1亿元B轮融资丨36氪首发真格天使项目「潞晨科技」完成数亿元A轮融资利用二氧化碳生产混凝土,「清捕零碳」完成千万元天使+轮融资|36氪首发「适宇科技」完成近千万元Pre-A轮融资,为新能源汽车提供热管理解决方案|36氪首发帮石化客户进行生产管理、提高生产效益,「中智软创」完成数千万元的B+轮融资|36氪首发贼喊捉贼式的新疆指控,让人出离愤怒打通大模型、中间层、产品应用三层能力,「西湖心辰」完成Pre-A轮融资|36氪首发主打按效果付费,跨境电商售后运营服务商「愚公科技」完成近千万元Pre-A轮融资|36氪首发又见桐花开我和聊天机器人(AI)对话明确「BI PaaS」差异化定位,「衡石科技」完成数千万元A+轮融资,推出指标中台|36氪首发「约塔科技」完成首轮融资,自研CT产品落地工业、安检、宠物医疗等领域|36氪首发用「分子电影技术」促进新药研发,「予路乾行」完成第二轮融资|36氪首发将AI技术应用于体外诊断领域,「医策科技」获数千万元天使轮融资|36氪首发「苇渡科技」获数亿元A轮融资,新能源重卡2024年量产|36氪首发
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。