李开复的新AI公司登陆大模型战场,百亿级模型已内测|最前线
资金和算力尚未成为掣肘零一万物的路障,但公司的人才焦虑是肉眼可见的。
文|周鑫雨
编辑|邓咏仪
来源|智能涌现(ID:AIEmergence)
封面来源|IC photo
距李开复发出AI英雄帖,过去了整整106天。
2023年3月19日,创新工场董事长兼CEO李开复在朋友圈宣布“亲自筹组Project AI 2.0,一个致力打造AI 2.0全新平台和AI-first生产力应用的全球化公司”。
3个月后,7月3日,Project AI 2.0终于揭开了业务和团队画像的一角。创新工厂官宣Project AI 2.0新公司“零一万物”,并上线官网(01.AI)。
创新工场表示,零一万物是其“塔尖孵化”的第7家公司。
所谓的“塔尖孵化”,是创新工场投资具有短板的初期公司的战略,特点是在创业者和学术圈之间建立紧密的人才、技术等方面的联系,涵盖甄别技术趋势、设定技术主题、挖掘技术人才、跟踪行业最新动态等环节。3月,宣布完成亿元人民币Pre-A轮融资的澜舟科技,就是创新工场采取塔尖孵化模式的公司。
自研大模型,是零一万物切入AI赛道的方向。为此,零一万物搭建了专供大模型训练、调优和推理的实验平台,资源储备包括数千卡GPU集群。
面对“重复造轮子”的质疑,零一万物用目前国内大模型赛道存在的两个问题做出了回应:一,许多声称效果类似ChatGPT 的开源模型,都只局限于简单对话,无法适应稍微泛化或复杂的任务;二,依赖开源生态不利于对大模型技术原理的研究,自身能力天花板容易被他人定义。
为了提高模型能力,零一万物采取了拆解技术路线、分步攻克的策略,包括7大模块:
1、定义模型能力天花板的预训练框架(Pre-train)技术;
2、精进模型实现能力的 Post-train(训练后)技术;
3、支撑模型高效训练的 AI Infra技术;
4、更多元化多介质的多模态模型技;
5、平台中间件及工具链技术;
6、推理部署技术;
7、服务部署技术。
据官方介绍,遵循模块化的技术路线后,零一万物在3个月内已经实现百亿参数规模的模型内测,且参数正往300-700亿的规模扩大。与此同时,零一万物也表示,未来不排除大模型开源的可能。
创新工场表示,目前“零一万物”已经有数十名核心成员,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发能领域。
从创新工场披露的团队成员背景来看,“顶尖大厂”“一把手”是最显著的标签。官方表示,已加入的联创团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁,包括36氪此前独家报道的前百度副总裁马杰。与此同时,零一万物算法和产品团队背景均来自国内外大厂。
将模型训练技术路线拆分为7个模块后,零一万物的野心是为每一个模块配备顶尖的技术专家,这也意味着人才焦虑仍在持续。官宣公司成立时,零一万物特意强调,简历投递通道已在官网(01.AI)开启。
作为国内AI界的标志性人物,李开复已经撸起袖子亲自入局。不过,创新工场对36氪表示:塔尖孵化是投入很重的模式,但开复不是全部ALL-IN到新公司去了,后续还会平衡基金和新公司。
36氪旗下AI公众号
来个“分享、点赞、在看”👇
微信扫码关注该文公众号作者