Redian新闻
>
晚点独家丨袁进辉新公司获创新工场、王慧文等 5000 万投资

晚点独家丨袁进辉新公司获创新工场、王慧文等 5000 万投资

财经

“第一次创业打出了技术影响力,这一次想证明好的技术能赚钱。”

文丨贺乾明

编辑丨程曼祺

OneFlow 创始人、光年之外联合创始人袁进辉近期宣布再次创业,成立新公司硅基流动(SiliconFlow)。


《晚点 LatePost 》独家获悉,硅基流动已完成 5000 万元人民币天使轮融资,由创新工场领投,耀途资本、奇绩创坛、美团联合创始人王慧文等跟投,投后估值为数亿元人民币。


袁进辉告诉《晚点 LatePost》,他和  OneFlow 核心团队从 2023 年 8 月开始筹备再次创业,新公司延续 OneFlow 的方向,做 AI Infra(AI 基础设施)层中的 “框架”。


AI 框架介于算力层和模型层之间,是一种系统软件,就像电脑操作系统能使普通用户直接用鼠标和键盘操作应用,AI 框架能帮开发者简单方便地设计模型或使用模型,而无需操心底层算力资源的调配。


不同的是,OneFlow 当年以通用训练框架为主,服务深度模型的生产;硅基流动则专注做推理框架,服务大模型的应用。


袁进辉认为,服务大模型应用比服务大模型生产更容易做出标准化产品,市场空间也大得多:模型生产是阶段性的,且由少数公司主导;大模型应用则会遍布各行各业、无处不在,被各种行业和规模的企业需要。

从 OneFlow 到 SiliconFlow,从训练到推理

袁进辉本科毕业于西安电子科技大学,2003 年考入清华大学计算机系,师从张钹院士攻读博士学位,做过机器学习、深度学习和脑科学的跨学科研究。


在 2013 年加入微软亚研院后,袁进辉做出了当时最快的主题模型训练算法和系统 LightLDA,之后又开始尝试研发 AI 训练框架,这也是 2017 年他创办的 OneFlow 的主攻方向。


当时市场上已有 Google 的 TensorFlow 和 Meta 的 PyTorch 等开源框架。袁进辉之所以觉得有创业机会,在于他有一个非主流的认知:未来 AI 模型会很大。


他的判断来自博士后阶段研究交叉学科的经历:人类大脑中有上千亿神经元,而当时最庞大的神经网络的参数(类似神经元)也没有破亿,大部分训练框架能满足当时模型的规模,却没有为巨大的模型优化。


袁进辉称,从 OneFlow 创业之初,他们就在开发大参数模型的训练框架,使用了现在大模型框架常用的分布式并行训练方法,这能提升用大量 GPU 同时训练单个模型的效率。


2022 年 11 月,PyTorch 发布分布式计算扩展程序 DistributedTensor 时,PyTorch 联合创始人苏米特·金塔拉(Soumith Chintala)还在社交平台上提到,部分灵感来自 OneFlow 的类似功能。


一位 AI 从业者曾告诉《晚点 LatePost》,OneFlow 训练大模型确实更方便,一般科技大公司使用的框架会在 Pytorch 或 TensorFlow 上又做一层封装和优化,但这些优化是面向信息推荐等已有业务定制的,不是针对大模型,“数亿参数和数百亿甚至上千亿参数的模型,训练框架要做的事差别很大”,OneFlow 则针对大模型训练做了优化。


2023 年初,大模型在全球获得广泛关注,OneFlow 的技术设想得到验证。同年 3 月,OneFlow 被光年之外并购,又 3 个月后,光年之外创始人王慧文因病退出创业,光年之外被美团收购,袁进辉选择再次创业。


“加入光年之外时是 40 人,再创业时有 35 人。” 袁进辉说,经过 2023 年的两次变动,OneFlow 核心团队仅有少数人员离开,关键原因是做推理系统的新方向让团队觉得有希望、有机会。

英伟达、亚马逊都在做推理框架,对手不乏大公司

推理框架的机会首先在于需求多、市场大。多位大模型从业者估算,如果大模型被广泛使用,大模型的训练和推理用量会达到 2:8,甚至 1:9。


这同时是一个客户相对分散的市场,供应商更有话语权,能自己生产大模型的公司是少数,基于模型开发应用或直接使用大模型的公司则多得多,它们都需要推理的优化。


推理成本偏高也正是当前的行业痛点,客户更愿意为此付费。传统软件一次开发、无限复制,边际成本显著降低;而用户每次调用大模型时都要消耗不少 GPU 计算资源做推理。这就是为什么付费版的 ChatGPT 也会限制用户使用 GPT-4 的次数,3 小时内最多用 50 次。


推理比训练有更大的成本优化空间。“用大量芯片训练大模型,硬件利用率的理论上限是 60% 多,英伟达同时做软硬件可以做到 50% 多,其它公司在这个基础上再优化,最多也只有约十个点的 margin;而推理环节还有数倍、甚至十倍的降本空间,推理的市场容量是训练的好多好多倍。” 袁进辉说。


袁进辉同时提到,做推理框架的资源门槛更低,对创业公司更友好。因为要做好大模型训练需要数千张 GPU 做实验平台,推理框架则可以使用规模小得多的算力资源做开发和优化。推理的需求也比较同质化,更容易做成标准产品,创业公司能集中精力做研发,减少定制化交付。


更大的市场机会、更低的资源门槛,意味着更多竞争对手,大小公司皆有:


  • 大型云计算公司会开发类似产品与 AI 计算资源绑定销售,如亚马逊云的 SageMaker 和阿里云的 PAI 等;

  • 芯片公司也会研发与芯片搭配的推理框架,如英伟达的 TensorRT-LLM;

  • 创业公司方面则有贾扬清(知名 AI 训练框架 Caffe 的作者之一)创办的 Lepton AI,陈天奇(机器学习算法 XGBoost、深度学习编译器 TVM 作者)参与创办的 OctoAI,新加坡国立大学教授尤洋创办的潞晨科技,清华电子系主任汪玉创立的无问芯穹等;

  • 学术界也有开源推理框架,如伯克利大学开发的 vLLM 等。


袁进辉并不担心硅基流动在这个领域的技术实力,他称公司的框架全部自研,并不基于英伟达的 TensorRT-LLM 或伯克利的 vLLM,这是目前最主流的两个推理框架。


据硅基流动展示,使用 8 块 A800 GPU 推理 700 亿参数的 Llama2,其语言大模型推理加速引擎 SiliconLLM 在吞吐、时延等指标上超过 vLLM、TensorRT-LLM,部分指标最高可达竞对产品的 10 倍。


袁进辉称,硅基流动拥有大量长期做 AI 框架的一线技术与工程人才,其中不少人是去了大公司相关团队又回来:“在业务庞大的大公司,AI 框架的优先级不见得很高,而对我们来说,这就是唯一。”

“第一次创业有了技术影响力,这次想证明好的技术能赚钱”

从 2017 年创业到 2023 年被收购,OneFlow 没让投资人亏钱,但也没能像国外同行那样独立盈利、快速增长,商业化谈不上成功。


OneFlow 的境遇不是个例,2016 年之后,中国出现一批基础软件创业公司,它们多尝试开源模式,发展初期有不错的融资,但多数越走越疲惫,鲜有跑出来的成功者。


这次创业前,袁进辉还是想着做一家面向企业客户的基础软件公司,他请教了创业成功的朋友,得到的反馈是悲观的:“我没想清楚为什么中国那么多优秀人才进入这个行业都做不好,也没看到你在这方面有超出常人的商业认知。”


对一家想做标准化技术 SaaS(软件即服务)的中国公司到底怎么走通商业化,袁进辉觉得现在他想得更清楚了。


决定创业时,他第一个想法就是积极开拓海外市场。袁进辉认为,海外、尤其是美国市场数字化程度较高,企业和开发者已经养成了软件付费习惯,培育出了 Databricks、Snowflake 等数百亿美元市值的公司,商业化难度较低,目前硅基流动已经谈下海外客户。


而在中国市场,他的策略是:绑定一个客户必须付费的产品,如硬件或云计算资源,一起卖软件。


带着 OneFlow 时期积累的经验和教训,袁进辉说,硅基流动有信心摸索出一条符合大环境的商业化路径。


在当前的融资环境下,留给硅基流动证明商业化能力的时间更紧迫了。


一位该领域创业者说,风投机构投资这类基础软件公司时,会因为创业团队的技术提供天使轮资金,但后续投资会更看重实际营收与客户,出手会越来越谨慎。


硅基流动的办公室在中国大模型和 AI 公司聚集地清华科技园。去年有一天,袁进辉去清华科技园楼下喜家德吃饺子,刚坐下就听到邻桌议论:“OneFlow 技术做得挺好 ...... 最后还不是没挣到钱,被收购。”


“有时我会想,我们是不是做了一个不好的范例?技术判断没问题,也勤勤恳恳做事,但还是无法取得大家认可的成功。” 袁进辉说,这次决定再创业,不想让团队四散分开,也是想努力证明和实现他觉得简单、正确的道理:“好的技术能赚钱。”

题图来源:《阿甘正传》

·  FIN  ·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【行业日报】美国岗位缺口创新低!AI学习初创公司获巨额融资!王慧文,刚投一位老友申万投资联手烟台国丰合作成立20亿航天投资基金晚点独家丨京东将重返春晚,意在获取下沉市场新用户晚点独家丨俞永福内部回应饿了么被收购传闻:假的晚点独家|B 站主站运营来了新主管,原负责人王宇阳将专注直播晚点独家丨蔚来 2024 年开年内部信:用好投资者的每一分钱《歌德堡变奏曲1452》晚点独家丨字节商业化新调整:懂车帝将成为独立公司;产品技术负责人刘小兵聚焦海外晚点独家丨比亚迪急招智驾人才,多款车型计划采用自研泊车功能反对用盗版软件开发芯片被开除,公司回应;腾讯游戏全线崩溃;美团买AI公司买个寂寞?创始人回应:王慧文替公司赎身|AI周报晚点播客「AI 大爆炸」丨光年之外联创再出发,与袁进辉聊 AI Infra 到底做什么随笔OpenAI推出在线商店GPT Store;百川智能发布角色大模型;王慧文参投老友AI公司|AIGC周观察第三十期早鸟报|董宇辉新号开播三天粉丝破1000万;内部人士回应罗永浩暂缓AR业务;1688年交易额8000亿元...忐忑回国行 (一)晚点独家丨特斯拉计划重启上海三期工厂项目,储能产品将供应国内瑞士申请加入文旅比拼、王健林已卖10座万达广场、韩国仁川新地标被质疑抄袭广州塔等 | 今日天下独家 | OneFlow 袁进辉再创业,成立新公司「硅基流动」一周资讯|董宇辉新号首播带货超1亿元;王者荣耀抖音直播将全面开放;懂车帝成独立公司...晚点独家丨长城汽车筹备自建直营店,首批数量或达百家2024中国首个AI新政发布;袁进辉创办新公司硅基流动;清华教授朱军入选AAAI 2024 Fellow丨AIGC大事日报BB鸭 | 小米汽车SU7工信部信息变更;华为与长安汽车成立新公司;优酷更新Logo;马斯克X公司获得美国15个州支付牌照周末随笔王慧文回来了!千亿级空天信息产业基金群在渝成立;申万投资联手烟台国丰设立航天投资基金,总规模20亿元丨11.20-11.26晚点独家|出海电商激战:Temu GMV 目标翻倍,SHEIN 保利润,TikTok 全力攻美国将恢复买卖!恒大系这些公司发布公告;董宇辉新号或准备校招丨大公司动态犹太理工男教授和大陆理工男教授晚点独家丨理想明年启动出海,把 L9 卖给中东富人百度 8500 万挖不来“AI 教父”;淘天年薪百万起步抢全球顶尖人才,上不封顶;王慧文病休后首次动作:AI 投资|Q资讯9点1氪:多家航司调整规则,机票买贵24小时内符合条件可免费退;A股现天价离婚案;董宇辉新号粉丝突破1000万OneFlow创始人:王慧文为我们“赎身” 美团没有对不起自己的股东早鸟报|​字节跳动回应懂车帝将成独立公司;​董宇辉新号首播带货超1亿元;极兔组织架构调整...晚点独家丨微信视频号电商 GMV 超千亿元,微信支付团队将参与建设
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。