狂飙200天：进退两难的中国大模型团战

公众号新闻

2023-07-07 13:07

共识可以快速形成，也可以快速瓦解。

文｜何丽芯

编辑｜于丽丽、刘旌‍

来源｜暗涌Waves（ID：waves36kr）

封面来源｜Christ in the Storm on the Sea of Galilee (Rembrandt van Rijn, 1633), Isabella Stewart Gardner Museum, Boston

极速200天

两个月前，“暗涌Waves”曾向一位投资了王慧文光年之外的基金合伙人提问：中国创投史上，哪个公司在创办之初就众望所归、并且最终也拥有美好结局？

“说实话，我很难想到。”这位投资人答道。

作为一位AI行业的“门外人”，王慧文的杀入格外有戏剧性，最终能有多大的胜算？

沉吟片刻后，这位合伙人打趣说道：“至少，老王是一个有争议的人。”他的言下之意是，对于多数头部美元基金来说，大概没有理由不投资王慧文这样“能够集资源、钱、以及号召力为一体的大佬”。

后来的故事众人皆知。伴随着王慧文确诊抑郁症，光年之外被美团接手，这个大模型创业潮中引发最多关注的故事戛然而止。

当我们提出那个问题时，中国大模型的创业还在狂飙之中。人们无比相信那个比“移动互联网大10倍”的平台级大机会：在GPT-4推出不过20余天时，已有超10余家创业公司坐上大模型牌桌，总融资额数十亿美金。此后包括大厂在内的20多家公司公布了自研AI大模型，“就连上古神仙的名字都不够用了”。

顷刻间，光年之外的戏剧化故事，似乎应验了通用大模型很难属于创业公司的预言。越来越多的公司开始逃离大模型神话。

时间回到一年前。在旧金山第18街和Folsom街交叉口，有一座不起眼的灰色三层小楼，很快它将名声大振——这是OpenAI的办公所在地。一位硅谷人士告诉我们，红杉的一位投资人和OpenAI沟通之后，“大为震撼”，这位如饥似渴的投资人而后便令团队“动起来！”

红杉再次展现出了它一贯的战斗力。2022年9月，红杉官网发表了《Generative AI, a Creative New World》一文，第一次提出生成式AI的概念。

“从硅谷到国内，创投风潮的传递大约会有3个月的延后。”一位美元投资人对“暗涌Waves”表示，所以ChatGPT在去年11月底发布，直至今年春节后，国内关于大模型的讨论才瞬间热烈起来。

春节后，踏上去硅谷航班的源码资本合伙人黄云刚，本来还想一并考察SaaS、Bio-tech，但最后几乎所有会议都和AI相关。此时想约OpenAI的人已不再容易：其员工后来基本关闭或隐藏了包括LinkedIn在内的各类个人联系方式。

这可能是过去十年、从硅谷到国内最快的一次共识收敛。

在生成式AI面前，本就力竭的移动互联网，顷刻仿若陈旧之物。新一轮的世界交接俨然已经开始。

人人都能感受到市场的躁动。2月中旬，在微软战略孵化器组织的一次AI分享会上，人头攒动，茶歇区被挤满，连咖啡师都在柜台里拿着手机拍PPT。墙上各种NFT印刷品的包围，似乎又在提醒人们这里数月前还属于Web3。

仿佛一种应激反应，国内投资人一头扎进AI，却又发现大量功课要做。多位投资人在采访中不约而同称自己“还在学习”，以及反问：你们最近还跟谁聊了？

今年3月，在接受我们访谈前一天的凌晨，阿尔法公社创始合伙人&CEO许四清正在“读paper”，然后接到一位成功创业者师弟的微信，问能否一聊AI。后者驱车20公里来到他的住处，两人一直讨论到凌晨三点才散去。

创投界的大小人物纷至沓来，王慧文也是群情激昂中的一份子。曾有接近他的人对“暗涌Waves”透露，王慧文对大模型创业的态度变化非常之快，原本他只是计划以投资的方式入股一家公司，但在三天内就决定躬身入局。

但风口总是不长命。尽管严格来说，相比于移动时代尾声的众多议题，大模型或AGI无疑是一个真命题。在GPT-4推出不过20余天时，市场已明显感受到，在这个注定是少数人的游戏中，国内通用大模型的创业潮首战已基本终结。

6月底，猎豹移动CEO傅盛和金沙江创业投资基金主管合伙人朱啸虎在朋友圈的互怼，在体现投资人和创业者视角种种差异的同时，也显示出一种异常冷静的共识：有机会，但不会是BAT式的大机会。

短短200天，更多的投资人和创业公司的焦点开始往垂直大模型或中间层、应用层迁移，而那个狂热的平台级或颠覆性的大机会，也逐渐被更现实的“零零散散的小机会”替代。

真格基金管理合伙人戴雨森曾对我们说，随着一波波新技术的兴衰，AI在创投界不断进入冬天和春天。每一次看似高蹈的技术理想面前，都悬着一把难以商业化的达摩克利斯之剑。

这次也没有例外。

浮沙上的高塔

共识可以快速形成。

ChatGPT的发布让国内市场的FOMO情绪在年初达到顶峰，团队和资金快速集结大模型。牌桌上的选手，分为：互联网创业派、大厂派，以及来自高校和研究机构的学院派。

共识也可以快速瓦解。

注定是烧钱游戏的属性，算力、数据和人才的门槛，以及当下资本市场的变化，让“大模型是否是创业公司的机会？”的诘问一直悬在头顶。

事实是在今年4月，“暗涌Waves”就注意到国内通用大模型创业潮的首战，已基本终结。这一说法后来也得到一些投资人证实，“就这些了”，此后声称要入局大模型的创业公司基本绝迹。

在一位一级市场观察人士看来，关于大模型，不光创业团队，敢下场的大基金也只有少数大名字，而且机构主要基于赌人的逻辑，前方还有漫长的证明题要做。

和傅盛论辩完的朱啸虎，第二天就在朋友圈表示，他的核心观点是：不要迷信通用大模型，因为明年GPT-3.5就成commodity（通用基础设施），而3年后，GPT-4也会是。

这背后正是关于大模型的另一重隐忧：底层的大模型本身在变，而未来很可能大量开源，或者1-2个头部厂商赢者通吃。如此一来，中国大模型创业的价值与投入就根本不成正比。

至于那个众人言说中的“比互联网更大的机会”，在戴雨森看来，立足点是“能做出可以使用工具、解决任务、分解任务的AGI”，而能实现这一点的团队，即便在世界范围内都很稀缺。

前不久，在Waves大会的一场圆桌论坛上，中国人民大学高瓴人工智能学院卢志武教授，就质疑了所谓“国产大模型的春天”。在他看来，这不过是很多公司在“微调国外底座模型”的假象。

现实也的确如此。一位AI创业者告诉我们，很多声称要做大模型的创业公司，其实从一开始就是在用Supervised Fine Tuning等快捷技术，做一个“还可以的”语言大模型出来，真正有资金和技术实力去挑战GPT4的团队和项目屈指可数。

更多创业公司开始向医疗、法律等垂直大模型以及中间层、应用层迁移。王慧文的光年之外，以及王小川的新公司，后来都选择了同时做大模型和基于模型的应用。

“42章经”曲凯发布的数据显示，以他的体感，前一段拿到融资的AI项目中，做底层模型的大概有10%-20%，做infra/中间层的有20%-30%，做应用层的有60%-70%。其中如果把还没拿到钱的也加进来，做应用的估计至少是95%+。

但垂直大模型以及应用这条路也并非坦途。对创业公司来说，垂直领域的场景和数据很难获取。而它所构建的能力又不能是通用大模型轻易覆盖的。

像infra/中间层，一位投资人曾在社交媒体上表示，旨在满足数据采集、标注、模型调度等MLOps需求的创业公司，会面临“中间商难赚差价”的夹心尴尬——前有免费开源工具，后有云厂商打包工具和服务。同时，“国内客户付费习惯仍然没有很好地养成，尤其在企业开支紧缩的经济恢复期”。

在Waves大会上，真格基金戴雨森提到，在中国做2B服务，会受到市场付费意愿、客户采购方式特点的限制。“中国互联网之前一大特点，就是要直接找用户收钱很难，很多时候都是羊毛出在猪身上。”像OpenAI和Claude在美国可以直接通过公有云卖API服务，而在中国只提供API还不够，“很多做大模型的公司针对企业客户，现在是连服务器带模型一起卖，还得提供训练和微调服务”。

上述在社交媒体发文的投资人还提到，应用层项目可以分为两种：那些垂直场景里深耕的老项目在积极接入大模型，手握数据做微调；而新项目谈格局为时尚早，在大模型的迭代能力被充分释放前，很容易“速生速死”。

这在海外市场已有表征。例如去年尚风头无两的美国独角兽Grammarly和Jasper，在GPT4发布后，现有功能即被代替，价值迅速被摊薄，朱啸虎公开称“这两家公司或将很快归零，根本守不住”。

今年3月，OpenAI发布论文开源了新模型代码：效果一步成图，1秒18张。有人因此评价“扩散模型Diffusion的时代结束了”。而此时距离后者成为2022“AIGC元年”诞生的重要技术基石，以及基于此带来许多模型的涌现，还不到一年。

所以这一波AI创业者、尤其是应用层公司，始终存在于一个左右互搏的困局里：不做，错过了是输；做了可能很快被替代，同样是输。

在Waves大会上，昆仑万维CEO方汉提到，他和中国最顶尖的产品经理交流后发现，对方还处在很懵的状态：“这一波大模型远超产品进展”。随后的独立演讲中，猎豹CEO傅盛快速反驳了这一判断：“产品经理并不懵，很多已经在行动”。但显然至今，还没有令人满意的杀手级产品出现。阿里巴巴、百度推出大模型的当日，股价均不同程度下跌。

这些特性也造成了一级市场的一种奇观：除了红杉中国、真格、源码、五源、IDG资本等机构，“机构新出手很谨慎，更多积极在促成老项目和portfolio往AI方向转，从而多出去融钱”。

在一些投AI投资人眼中，不光是模型升级问题，如果AI安全冲突——这个普罗大众更关心的问题——进一步加剧，也可能会让AI浪潮再次进入低谷，这一次的AI信仰还能持续多久？

十年AI梦

十余年来，AI风口在创投界一直回环往复地出现。

技术路线的不停演化，让这个行业充满了那种“枪出现之前，研究如何能磨一把更快的刀”以及“发现未被识别的枪”的故事。

如同深度学习路线在2012年以前被忽视一样，在AlphaGo最热的2016年，通用人工智能被业界普遍认为不可能实现。“2018年GPT1推出，在当年看来是离经叛道的路。”绿洲资本创始合伙人张津剑曾对我们描述，当时的行业主流路线是垂直模型、人工标注，“仿佛雕花”，而GPT做通用，“强行用大量数据硬怼，在学界看起来很粗鲁”。

出门问问创始人兼CEO李志飞回忆起2年前开始做大模型的经历：团队顶着很大压力，技术总监几度提出离职。而此时其实距离谷歌2017年发表Transformer模型、为通用人工智能打开了第一扇门，已经过去了三年，然而少有人识别出背后的意义。

追溯历史，从1960年代人工智能概念在学界被提出以来，仅本世纪就诞生过两次AI浪潮。

2012年，在全球最大规模的视觉识别比赛中，时年65岁的Geoffrey Hinton教授带领两名学生拿下冠军。成功来源于在一种新的AI研究范式中找到突破：以深度学习为代表的神经网络派，从此前沉寂20余年的学术边缘研究，一跃成为正统主流。

之后十年间，深度学习成为大多数人工智能企业的底层技术基础，并从学术走向产业，在视觉、语音和语义技术等领域率先应用。

在中国，语音识别领域，诞生了出门问问、科大讯飞、云知声等公司，图像识别领域，则出现了AI四小龙旷视、依图、商汤、云从以及第四范式等。

而在2016年，谷歌AlphaGo在人机围棋比赛中以绝对优势击败世界围棋冠军李世石，让“机器智慧战胜了人类”的现实，第一次在大众层面上被广泛认知。这迅速引发了全球AI军备竞赛，并很快迎来国家政策层面的支持。

在这场AI热潮中，大厂宣布All In，陆奇空降百度，腾讯、字节等相继组建AI Lab，阿里达摩院成立，马云喊出“三年投入1000亿元”的豪言。

各大科技论坛上，人们乐此不疲地探讨“奇点已来”和机器人三定律，投资人笃信，人工智能将是继蒸汽机、内燃机和互联网之后的第四次生产力革命。

彼时的创投行业正面临投资主题的缺乏（与当下不无相似），几次互联网大并购相继落幕，平台型机遇消退，巨头的触角无处不在。AI和直播短视频、共享单车等一起，接棒成为热门赛道。

AI投融资趋于狂热。有报告显示，2016年全球AI融资规模近百亿美元，相当于2000年到2013年13年间总融资额之和。一个侧面佐证是，在2016年全球股市低迷的情况下，英伟达股价依然涨了3倍。

但疲态很快显现。2019年，中国在AI领域的投资额与投资笔数大幅下降，9成AI创业公司处于亏损状态。猛烈降温开始了。

据IT桔子等数据显示，2014年至2018年，中国人工智能领域的IPO退出平均回报仅为1.83倍，2018年全年有将近90%的人工智能公司处于亏损状态。2019年，“投资人逃离人工智能”刷屏，经过几年凋敝，除联想之星、创新工场等机构外，国内真正在持续关注AI的投资人寥寥，大基金也几乎没有专人在长期覆盖。

可以说，除了少数早期投资者落袋为安，AI至今是一个没能让投资人赚到大钱的赛道。

一则至今被反复提起的投资人旧闻，或能代表其间惨烈：成立于2013年的格灵深瞳，传言公司在拿到天使轮后，徐小平在饭局上称其至少估值5000亿美元，而沈南鹏认为1000亿美元比较实际，最终妥协在了估值3000亿美元的中间数上。而现实让所有人意外，时隔9年，经历了流血上市的格林深瞳去年终登科创板，当前市值是65亿人民币（以7月6日收盘价计算）。

AI十年，至今还走在阻且长的道路上。

在旷视的首位投资人、联想之星总裁/主管合伙人王明耀看来，十年前的AI创业者处在摸索阶段，背景大多来自学术界，对变现的思考不甚清晰，加上并不成熟的产业配套，共同导致了AI商业化道路的漫长。

2011年，联想之星决定扶持三位年轻人走上创业之路，旷视当时估值仅1400万人民币。天使轮后，为避免人民币无钱可融，公司才转为美元架构。彼时资本市场的低预期，让“早年的AI创业者起步很难”。之后，旷视从CV游戏一路到相亲社交、商品推荐的尝试都不顺利，直到2015年与支付宝开始人脸支付合作。王明耀回忆，公司甚至“成立5年才拿到第一笔政府安防订单”。而今天的市场，不可同日而语。

这也让创投界对AI的又一次狂热，显得格外义无反顾。而这次技术进步最大的意义不同在于——AI第一次具备了通用的可能。

如果说过去十年深度学习的两轮AI创新，仍然是点状分布，是面向特定任务的智能、作用于垂直行业，这一轮的大模型则是李开复所说的“从孤岛到大陆”的进步：无需人工标注，模型规模大，具备跨领域能力。

技术突破对旧世界的改造是剧烈的。一位互联网投资人对我们说，新浪潮之下，像商汤、旷视这样的大公司，至少还留下了大量算力和经验储备。而对更多的AI企业来说，随着技术的演化，或将“创业未半而中道崩殂”。

回不去的旧世界

“Holy shit！”DCM董事合伙人林欣禾脱口而出。

这是22年初联系到Tiamat创始人青柑时，林欣禾第一次看到文生图效果的下意识反应。

这位亲历互联网浪潮的成功创业者，一直活跃在一线的古典互联网投资人。在对“暗涌Waves”描述当时情境时，他毫不掩饰惊讶，并坚定认为“新一代AI浪潮真的来了”，“不再以TMT时代的推荐为逻辑，而是直接替人完成所有事，人连鼠标都不用动。”

尽管对AI的投资还在迷雾中行走，甚至在短期内都将保持低沉，但这不妨碍它持续向旧世界开炮：像SaaS、出海等大量原有商业模式，面对即将被AI改写的命运。

一位长期关注企业服务的投资人认为，未来中国的SaaS公司，甚至所有2B企业，都应该是人工智能公司，软件将被智能即服务所替代。

AI一方面降低服务成本&提高人效，另一方面打通服务的流程环节。如果仍然是一家传统的软件公司，“那基本没戏了。”

风暴同样席卷原有的AI创业者，技术路线的失灵，带来的危机只会更甚：上一波基于深度学习做垂直小模型的AI公司，要么革命，要么死亡。

李志飞举例，以前很多做NLP的人，总觉得这些变化影响不到自己，“过去有PhD或教授专门研究语法解析、词性标注，未来这些中间环节都会消失”。很多从业者如今终于意识到，未来就不应该存在一个专门做机器翻译、问题回答或语音识别的工种。如果不转型，就将面临失业或工作无人关注的窘境。

在一些投资人看来，当生产力的供应结构被重新塑造，无限量的初级工程师将由AI替代。被长期作为中国商业自信叙事一部分的“工程师红利”，或将不再存在。

心识宇宙创始人陶芳波认为，面对AI，接下来只有两种人：“溺水者or淘金者”，他进而反问到：“蒸汽火车来的时候，难道只影响马车司机吗？”

真格基金合伙人刘元则表示，对于投资人和创业者来说，这意味着“三五个人可以干翻大厂的机会”又重新存在了。他甚至感觉，“之前所有的积累恰好是为这一刻准备的”。

刘元在2014年入行，作为早期投资人，他“偶尔觉得有些生不逢时”：错过了移动互联网最好的2011-2012，后来的双碳、新能源、汽车等风口又极度资本密集。而突然，TMT投资人所熟悉的数据飞轮、颠覆式创新、产品思维同理心等经典理论，“好像又重新有用了”。

在访谈中，刘元反复向我们提到维特根斯坦的那句名言：“语言的极限就是世界的极限”。他说，这是AGI更令他激动的部分：如果人的思维就是一个语言过程，那文科生臆想中的世界极可能在语言大模型上实现。

目前，经过第一阶段的角逐，许多投资人们似乎更看好大厂的大模型试验。

不过，正如不久前下场大模型的幻方创始人梁文锋所言，“市场是变化的。真正的决定力量往往不是一些现成的规则和条件，而是一种适应和调整变化的能力。“而这或许才是创业公司的缝隙。

林欣禾在欢呼新时代到来的同时，也认为当前很多大模型有“因为缺乏应用而受阻”的可能。他类比五六年前美国AR/VR赛道的火热：谷歌眼镜烧钱无数，但至今未做出来。何况在这波AI革命中，软件尚未和硬件充分结合，“很多事情We still have to see”。

但无论如何，在林欣禾看来，ChatGPT就像一道玻璃门，一旦跨过就再也回不去了：“AI is the new internet.”

这场至今不过200天的创业潮，或许正是未来创投故事的典型样貌：道路无疑正确，但注定漫长。

36氪旗下投资报道公众号

👇🏻 真诚推荐你关注 👇🏻

来个“分享、点赞、在看”👇

中国大模型团战

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章