中国大模型舰队的高调组局现象中国大模型的关键人物都集中在少数的几个局里。在王慧文下决心创业之初,源码资本创始合伙人曹毅连续见了他几次面。待王慧文入局后,曹毅支持称,愿意拿出相当比例的资金额度,押注王慧文这个人。曹毅投资师承红杉中国创始及执行合伙人沈南鹏,曾是红杉最年轻的副总裁,于2014年离开并创立源码资本。该基金被认为是新锐派代表之一。一开始,王慧文正在几个想法之间剧烈变化。他想拿5000万美元支持中国通用人工智能(AGI)事业。选择之一是,这5000万美元分散投给5个项目;选择之二是,5000万美元中一部分,比方说3000万美元给自己买一张船票,其余2000万美元给其他人买一到两张船票;但很快,他全然放弃了前两个想法,而是选择为自己“买了一张全家福”——创立人工智能公司光年之外。由于曹毅快速且坚决地下注,源码成为了光年之外第一轮开放给机构股东的领投方。其他参与本轮融资的投资方是一众投资圈明星,包括红杉资本、五源资本、腾讯、真格基金、今日资本、宿华、王兴等。据知情人士称,由于各方高涨的热情该轮融资总意向认购金额高达5亿美元,但王慧文没要这么多,最终融资规模大约为3亿美元。该轮融资估值超过10亿美元。光年之外是中国大模型创业舰队中备受瞩目的一支,项目特色是创始人有创造千亿级市值公司的创业经验(是美团联合创始人),带资入组诚意大,有号召力和令人信服的格局。虽不懂AI技术,但王慧文在组织、战略、节奏把握和产品能力上突出。此外,这轮大模型创业潮,大佬之间的组局现象显著。以沈南鹏为例,他最近数月有些事必躬亲,会亲自约见一些大模型创业者。在中国创投行业,红杉被认为是应对此轮AI浪潮最激进的基金之一。多位不同基金的投资人表示,就在一些基金还在几家初创企业中摇摆时,红杉在多个大模型及应用的创业局里都“放了钱”。而沈南鹏的表现也象征着此轮创业潮的特征之一——此番皆为“诸神之战”,大佬们披甲上阵。“他们觉得时代又来了,都来劲了,又可以亲自上阵。”一位美元基金投资人说。据了解,除了沈南鹏和曹毅,奇绩创坛创始人兼CEO陆奇、今日资本创始合伙人徐新、真格基金管理合伙人戴雨森等,都是这轮创投潮中的积极派个人代表。“这次都是老板,像分析师一样。”他们独揽了从找项目、看项目、见创始人,到谈条款等所有环节,甚至有些基金连公众号都在老板的亲手指挥下写作完成。就在这部分VC界大佬群起沸腾时,另一边,这也导致“下面的年轻投资人根本就没有事做”。不仅投资人如此,中国大模型以及其上的应用层创业者,在融资过程中也呈现出两极分化严重的现象。如王慧文、闫俊杰、杨植麟、王小川等被认定为第一梯队的创业人选,VC会扎堆抢份额,估值水涨船高。有些公司在第一轮面向机构股东的估值就已高达10亿美元,他们往往在开放给机构股东前自己先会投一小轮——开场即是独角兽,这在互联网应用的时代不可想象。但这只是极少数个例。更普遍的大量的被暂时认定为第二、甚至第三梯队的创业者们,则在一级市场境况惨淡。除了王慧文的局,大模型创业舰队还至少包括以下这些,清华系盘踞半壁江山。1、前商汤科技副总裁闫俊杰创立的MiniMax。该公司已达独角兽规模,但行事颇为低调。投资方包括腾讯、米哈游、IDG、高瓴创投、云启资本和明势资本等。2、杨植麟创立的月之暗面。杨毕业于清华和CMU,被认为是中国顶尖的AI研究人员之一,曾与图灵奖得主杨乐昆和约书亚·本吉奥分别发表过合作论文。他目前是清华交叉信息研究院助理教授,也是循环智能联合创始人。这个项目很多VC愿意投,因为杨年轻,本人有技术号召力,团队里也有众多技术明星。同时,他积累了一些创业经验,大模型是他的第二个创业项目。据了解,红杉对这个项目有孵化作用,红杉与真格是天使轮投资方。3、清华计算机系李涓子和唐杰教授担任首席科学家的智谱AI。该项目特色是,首席科学家的学术地位高,产品ChatGLM推出得早且效果不错。该公司CEO张鹏是李涓子和唐杰同门师弟,师从王克宏教授。张鹏说,他们所在的知识工程实验室有既做科研又做工程落地项目的传统,智谱AI脱胎于此前尝试的业务:科技情报系统。正是做这套系统期间,他们找准大模型赛道,于2020年开始投入。这家公司的气质更偏学院派和技术理想主义,张鹏对内有一句名言:“我们现在不管融多少、挣多少钱,都是我们通向 AGI 这条路上的盘缠。”该公司目前为B轮,投资方包括启明创投和君联资本。据了解,按照国家知识成果转化的相关规定,清华大学也占该项目一部分股份。4、王小川创立的百川智能。王小川是搜狗创始人和前CEO,项目优势是创始人有技术背景,在这轮创业中最大的标签是做过搜索引擎。他们获5000万美元融资,启动资金来自王小川与业内好友的个人支持。5、前Google科学家、出门问问创始人兼CEO李志飞。他原本打算另起炉灶创业做通用大模型,但很快,随着巨头和资金疯狂涌入,大模型的门槛被踏得粉碎。于是,他选择了一条更现实的路——基于出门问问原有业务继续做大模型底层及各类应用。这让他暂无融资需求。5月底,出门问问向港交所递交上市申请。6、周伯文创立的衔远科技。他是清华大学电子工程系长聘教授,在工业界也有建树,曾任IBM人工智能基础研究院院长、Watson Group首席科学家;2017年回国任京东高级副总裁,负责AI研究与平台部相关业务。目前该公司完成了数亿元人民币规模的天使轮,投后估值为10亿元人民币,投资方包括启明创投和经纬创投。7、蓝振忠创立的西湖心辰。他目前是西湖大学教师、深度学习实验室负责人。蓝毕业于CMU,后在Google AI部门做自然语言处理和计算机视觉的研发,曾主导研发了谷歌大模型BERT的轻量化版本:ALBERT。回国后,蓝创业起步做心理咨询的垂类模型,通用大模型出现后他意识到这个很容易被颠覆,因而转型。西湖心辰的投资人包括蓝驰创投、百度风投和汤姆猫。据了解,王慧文曾接触并想收购西湖心辰,邀蓝振忠加盟,但最终没谈拢。8、前微软亚洲研究院副院长周明创立的澜舟科技。投资方包括创新工场、联想创投、中关村科学城等。9、清华计算机科学与技术系长聘副教授黄民烈创立的聆心智能。投资方包括清华控股、智谱AI、无限基金SEE Fund等。10、岂凡超创立的深言科技。他是清华2017级博士毕业生,师从清华计算机科学与技术系教授、人工智能研究院常务副院长孙茂松。孙茂松是深言科技的首席科学家。投资方包括红杉、奇绩、腾讯、好未来等。11、清华计算机科学与技术系副教授刘知远创立的面壁智能(刘知远也是孙茂松的学生)。投资方包括知乎和智谱AI,知乎CTO李大海已兼任面壁董事兼CEO。12、创新工场董事长兼CEO李开复筹组的“Project AI 2.0”项目。……一位基金管理合伙人将这轮大模型创业者分三派:大佬派、学院派和已在路上的创业者。“最后一拉发现,就这十来个项目。大家就集中在投这十来个项目,融不到钱的就融不到钱。”另一位基金的创始合伙人说。“所有人都知道哪些人要创业,这是前所未有的。”一位基金的合伙人说。据他观察,中国创投行业2023年上半年的情形是,一线投资人见面会先对一遍你见了谁,发现大家都见过,接着交流观点,最后,“所有人都一起进了”;而二线投资人见不到其中许多创业者。同时,一线基金也大多由老板亲自去见创业者,所以“这次投资对年轻的投资人不友善,大佬直接跟大佬都认识,不需要通过年轻人找项目”。上述创始合伙人分析称,组局背后有多重成因:其一,大模型创业是太过昂贵的游戏——这不仅体现在人才密度高及相应的人力成本上,更体现在资金门槛上。“要做大模型,怎么也得融个2亿美金以上,或者说pipeline里头有2亿到3亿美金——人家排着队要给你钱的,得有这么多。”他估算称,“差不多一个创业公司一年烧5000万美金到1亿美金是很正常的。”其二,它的商业化落地周期漫长甚至遥遥无期,要打持久战役。其三,这件事不是一个人就能干出来,需要一组人,包括但不限于算法、架构和工程的顶级人才。而更关键的是,这次机会实在太大了,即便大佬们也害怕擦肩而过。况且,此次形势特殊。“不太像自然增长,而是有点拔苗助长的意味。”一位参投了上述大模型项目的投资人称。“这个时代跟淘金时代很像。如果你那个时候去加州淘金,一大堆人会死掉,但是卖勺子、卖铲子的人永远可以赚钱。”陆奇曾说道。他判断,大模型是平台型机会;以模型为先的平台,将比以信息为先的平台体量更大。“有可能这是历史上第一个10万亿美元的公司。”所以不论如何,很多人都要奋力一搏。否则,“The price is too big(代价实在太大)”。于是,大佬与大佬们在中国AI浪潮的起点通过资本结盟。他们既是朋友,又是利益共同体。他们开出手中一张张巨额支票,原因很简单——重金赌注大方向和他们信任的人。这场豪赌甚至违背了一些VC内部判断标的的准则。未来应用场景是什么、商业模式如何、烧钱要烧多久才能看到回报,甚至这里究竟有没有创业公司的机会、VC能不能从中获利等现实考量,很多并无清晰答案。但他们为自己购置了最奢侈的入局门票。也因为有钱,这增加了所有人的底气。后来,没参投的投资人再去约见某些创始人,对方礼貌地回绝了。他说,自己实在太忙,因而,只有时间见投过钱给自己的人。
02
久违的狂热下,投资人出手异常审慎如果你以为,过去5个月中国VC在新一轮技术革命的高亢情绪中积极出手,那就大错特错了。针对这股骤起的技术浪潮,投资人心态迥异。一位互联网公司高层人士观察调侃称,他今年见到的VC大体分三类,第一类是兴奋派,他们觉得这是弯道超车的一次良机;第二类是保守派,这类VC大概率是过往红利的既得利益者,不希望大变革发生;第三类则是焦虑派,因为今年一二月份刚把项目处理好,春节ChatGPT火了后,所有规划要推翻重来,因而很焦虑、很沮丧。表面看,中国风投业正经历着自移动互联网浪潮红利消弭后,久违的狂热。“所有人都被搅动了。”蓝驰创投管理合伙人朱天宇说,“过去三五年都没有见过,这么密集的创始人在active地想要干什么事。”据他观察,这些人很多经历过移动互联网增长陡峭的黄金时期,不少人已“成功上岸”,过去两三年要么赋闲、要么旅居海外,“到后来都感觉要养生了”。但最近,他们全出来了。而他自己,这几个月生活轨迹骤变,每周见项目的数量是过去的3至4倍。这从技术突破上有迹可循。深度学习奠基人、全球前十大AI科学家之一的特伦斯·谢诺夫斯基(Terrence Sejnowski)表示,大语言模型带来了深度学习新范式。最大改变是,此次生成模型采用自我监督学习方法,不再依赖标记数据——以前需要给数据打标签,这是有监督学习,需要人工标注因而耗费资源;而通过自我监督,可以直接使用数据。“美妙之处在于,你只需要训练它预测下一个单词或句子。如果训练数据无穷,就不再有约束了。”他说,“一切都将在你的有生之年发生转变。”更直接的是,从去年Midjourney、Stable Diffusion诞生起,AI就从纯粹的技术演化变成终端用户可感知的产品,ChatGPT更将此推向高潮。技术突破外加杀手级的终端产品,成为AI浪潮的引爆点。投资人的共识是:AI浪潮不同于元宇宙、区块链等短暂风口,它有长期价值支撑,会是未来十年的机遇。现在只是开端。所以不论主动或被动,他们都在尽可能多地搜罗AI项目,各地黑客马拉松也如火如荼。然而,中国VC过去5个月真实的出手数量与这种看似火热的情绪相比,反差巨大。综合多位基金的投资人称,今年真实的交易数量,和在去年处于市场冷淡低迷中的投资数量并无二致,有的基金甚至比去年同期缩减了三成。“大家都在积极地看。”上述基金创始合伙人说,“但是你说大家在很active地出手么?也没有。”他所在的基金和市场上很多基金一样,截至当时,今年一个AI项目都没出手。谨慎的原因有很多。第一层原因是,中国大模型还没有稳定下来一个格局,因而上面的应用难以生长。而通用大模型到底是巨头的盘中餐还是创业公司的新机会,尚无定论。一种观点是,OpenAI有机会,是因为美国巨头都“打瞌睡了”,而中国第一波觉醒势要追赶的就是巨头们。所以一类从根本上相信大企业更有机会的投资人,会谨慎把钱投向要做通用大模型的创业者。另一类投资人相对纠结。“红杉是钱多,要钱不够多,你也不会在多家公司都放一点。”倘若不是同时下注,就要从牌桌上挑选最有可能决胜的一家,但现在除了分析创始人,可供判断的维度太少,难以决断。第二层原因是,如果不投通用大模型,投资人就会看垂直领域大模型。这也面临两难。首先,垂直领域的数据需要特别且稀缺;其次,它具备的能力必须不是大模型“伸伸手就能做的”,比如大量的文字生文字就是大模型能覆盖的能力,价值不大。那么,究竟哪些行业数据足够深,能建立的门槛足够高,创业公司又能做,答案亦不清晰。这导致“划掉一些不应该投的很容易,但回答什么是应该投的,没有答案”。一位投A轮左右轮次的投资人观察说,“中国这种项目还比较少,大家都在一窝蜂地搞通用大模型”,所以作为投资人“要是不投大模型,国内标的有限”。第三层原因是,一切变化太过迅疾,投资人们找不到恒定不变的锚点是什么。“现在,就觉得什么东西都像在流沙上一样。”这在VC中滋生出一丝悲观主义气息——既然底层的大模型什么都能做,上面的应用看起来只是在“雕花”。“在移动时代,一个产品很惊艳,那很好;但今天会想,它能让你体验这么好的原因,底层如果是大语言模型,但这个模型不是团队自己的,同时模型本身也会变”,这就让以前认知中的很多经典意义上的护城河失效了。另外,大部分投过上一轮AI和软件企业的投资人,在这一轮更加克制。因为他们知道,若商业模式仅限to B,一来,中国的商业环境对于SaaS产品“土地不平整”,大量企业没有数字化,SaaS产品无用武之地;二来其商业化落地会相当迟缓。这些都致使面对今天激动人心的技术大爆发,很多中国VC的态度是:仍在观望中。不过,在一片谨慎的VC间,这几家基金稍显例外——若单从投资项目数量看,源码、奇绩、真格、蓝驰、五源、红杉等,在场上的表现相较同行更活跃。朱天宇理性分析道,他们也对比了互联网爆发的时间图谱,结论是AI还处在很早期的阶段,“有些现在冒出来的应用,不一定是稳定的、能站得住的机会”。即便如此,这几家基金表现踊跃,背后原因很容易理解——蓝驰、奇绩、真格是投天使轮的基金,而红杉、源码、五源近些年也加重了投早期的力度。越是投早期,越是笃信“人是生产要素里最活跃的因素”,他们更乐于在没有一张BP、只有人的阶段出手。“很多人觉得变化太快,现在不敢下手。但现在就是要bet on founders(赌注创始人)。”朱天宇说,“founder是船长,他在惊涛骇浪里navigate(导航),出现变化让他来解决。”但总体而言,中国大部分VC的真实出手数量远远低于他们表现出来的高涨情绪。“我想很客观说,除了大佬,事实上拿到投资的人是有限的。”另一位美元基金的合伙人说道。一面狂热、一面冷峻——这是中国大模型现状。