李开复的新AI公司登陆大模型战场，百亿级模型已内测｜最前线

公众号新闻

2023-07-04 14:07

资金和算力尚未成为掣肘零一万物的路障，但公司的人才焦虑是肉眼可见的。

文｜周鑫雨

编辑｜邓咏仪‍

来源｜智能涌现（ID：AIEmergence）

封面来源｜IC photo

距李开复发出AI英雄帖，过去了整整106天。

2023年3月19日，创新工场董事长兼CEO李开复在朋友圈宣布“亲自筹组Project AI 2.0，一个致力打造AI 2.0全新平台和AI-first生产力应用的全球化公司”。

3个月后，7月3日，Project AI 2.0终于揭开了业务和团队画像的一角。创新工厂官宣Project AI 2.0新公司“零一万物”，并上线官网（01.AI）。

创新工场表示，零一万物是其“塔尖孵化”的第7家公司。

所谓的“塔尖孵化”，是创新工场投资具有短板的初期公司的战略，特点是在创业者和学术圈之间建立紧密的人才、技术等方面的联系，涵盖甄别技术趋势、设定技术主题、挖掘技术人才、跟踪行业最新动态等环节。3月，宣布完成亿元人民币Pre-A轮融资的澜舟科技，就是创新工场采取塔尖孵化模式的公司。

自研大模型，是零一万物切入AI赛道的方向。为此，零一万物搭建了专供大模型训练、调优和推理的实验平台，资源储备包括数千卡GPU集群。

面对“重复造轮子”的质疑，零一万物用目前国内大模型赛道存在的两个问题做出了回应：一，许多声称效果类似ChatGPT 的开源模型，都只局限于简单对话，无法适应稍微泛化或复杂的任务；二，依赖开源生态不利于对大模型技术原理的研究，自身能力天花板容易被他人定义。

为了提高模型能力，零一万物采取了拆解技术路线、分步攻克的策略，包括7大模块：

1、定义模型能力天花板的预训练框架（Pre-train）技术；
2、精进模型实现能力的 Post-train（训练后）技术；
3、支撑模型高效训练的 AI Infra技术；
4、更多元化多介质的多模态模型技；
5、平台中间件及工具链技术；
6、推理部署技术；
7、服务部署技术。

据官方介绍，遵循模块化的技术路线后，零一万物在3个月内已经实现百亿参数规模的模型内测，且参数正往300-700亿的规模扩大。与此同时，零一万物也表示，未来不排除大模型开源的可能。

创新工场表示，目前“零一万物”已经有数十名核心成员，集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发能领域。

从创新工场披露的团队成员背景来看，“顶尖大厂”“一把手”是最显著的标签。官方表示，已加入的联创团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁，包括36氪此前独家报道的前百度副总裁马杰。与此同时，零一万物算法和产品团队背景均来自国内外大厂。

将模型训练技术路线拆分为7个模块后，零一万物的野心是为每一个模块配备顶尖的技术专家，这也意味着人才焦虑仍在持续。官宣公司成立时，零一万物特意强调，简历投递通道已在官网（01.AI）开启。

作为国内AI界的标志性人物，李开复已经撸起袖子亲自入局。不过，创新工场对36氪表示：塔尖孵化是投入很重的模式，但开复不是全部ALL-IN到新公司去了，后续还会平衡基金和新公司。