Redian新闻
>
狂飙200天:进退两难的中国大模型团战

狂飙200天:进退两难的中国大模型团战

公众号新闻

共识可以快速形成,也可以快速瓦解。


何丽芯

编辑于丽丽、刘旌

来源|暗涌Waves(ID:waves36kr

封面来源Christ in the Storm on the Sea of Galilee (Rembrandt van Rijn, 1633), Isabella Stewart Gardner Museum, Boston

极速200天
两个月前,“暗涌Waves”曾向一位投资了王慧文光年之外的基金合伙人提问:中国创投史上,哪个公司在创办之初就众望所归、并且最终也拥有美好结局?
“说实话,我很难想到。”这位投资人答道。
作为一位AI行业的“门外人”,王慧文的杀入格外有戏剧性,最终能有多大的胜算?
沉吟片刻后,这位合伙人打趣说道:“至少,老王是一个有争议的人。”他的言下之意是,对于多数头部美元基金来说,大概没有理由不投资王慧文这样“能够集资源、钱、以及号召力为一体的大佬”。
后来的故事众人皆知。伴随着王慧文确诊抑郁症,光年之外被美团接手,这个大模型创业潮中引发最多关注的故事戛然而止。
当我们提出那个问题时,中国大模型的创业还在狂飙之中。人们无比相信那个比“移动互联网大10倍”的平台级大机会:在GPT-4推出不过20余天时,已有超10余家创业公司坐上大模型牌桌,总融资额数十亿美金。此后包括大厂在内的20多家公司公布了自研AI大模型,“就连上古神仙的名字都不够用了”。
顷刻间,光年之外的戏剧化故事,似乎应验了通用大模型很难属于创业公司的预言。越来越多的公司开始逃离大模型神话。

时间回到一年前。在旧金山第18街和Folsom街交叉口,有一座不起眼的灰色三层小楼,很快它将名声大振——这是OpenAI的办公所在地。一位硅谷人士告诉我们,红杉的一位投资人和OpenAI沟通之后,“大为震撼”,这位如饥似渴的投资人而后便令团队“动起来!”

红杉再次展现出了它一贯的战斗力。2022年9月,红杉官网发表了《Generative AI, a Creative New World》一文,第一次提出生成式AI的概念。

“从硅谷到国内,创投风潮的传递大约会有3个月的延后。”一位美元投资人对“暗涌Waves”表示,所以ChatGPT在去年11月底发布,直至今年春节后,国内关于大模型的讨论才瞬间热烈起来。
春节后,踏上去硅谷航班的源码资本合伙人黄云刚,本来还想一并考察SaaS、Bio-tech,但最后几乎所有会议都和AI相关。此时想约OpenAI的人已不再容易:其员工后来基本关闭或隐藏了包括LinkedIn在内的各类个人联系方式。
这可能是过去十年、从硅谷到国内最快的一次共识收敛。
在生成式AI面前,本就力竭的移动互联网,顷刻仿若陈旧之物。新一轮的世界交接俨然已经开始。
人人都能感受到市场的躁动。2月中旬,在微软战略孵化器组织的一次AI分享会上,人头攒动,茶歇区被挤满,连咖啡师都在柜台里拿着手机拍PPT。墙上各种NFT印刷品的包围,似乎又在提醒人们这里数月前还属于Web3。
仿佛一种应激反应,国内投资人一头扎进AI,却又发现大量功课要做。多位投资人在采访中不约而同称自己“还在学习”,以及反问:你们最近还跟谁聊了?
今年3月,在接受我们访谈前一天的凌晨,阿尔法公社创始合伙人&CEO许四清正在“读paper”,然后接到一位成功创业者师弟的微信,问能否一聊AI。后者驱车20公里来到他的住处,两人一直讨论到凌晨三点才散去。
创投界的大小人物纷至沓来,王慧文也是群情激昂中的一份子。曾有接近他的人对“暗涌Waves”透露,王慧文对大模型创业的态度变化非常之快,原本他只是计划以投资的方式入股一家公司,但在三天内就决定躬身入局。
但风口总是不长命。尽管严格来说,相比于移动时代尾声的众多议题,大模型或AGI无疑是一个真命题。在GPT-4推出不过20余天时,市场已明显感受到,在这个注定是少数人的游戏中,国内通用大模型的创业潮首战已基本终结。
6月底,猎豹移动CEO傅盛和金沙江创业投资基金主管合伙人朱啸虎在朋友圈的互怼,在体现投资人和创业者视角种种差异的同时,也显示出一种异常冷静的共识:有机会,但不会是BAT式的大机会。
短短200天,更多的投资人和创业公司的焦点开始往垂直大模型或中间层、应用层迁移,而那个狂热的平台级或颠覆性的大机会,也逐渐被更现实的“零零散散的小机会”替代。
真格基金管理合伙人戴雨森曾对我们说,随着一波波新技术的兴衰,AI在创投界不断进入冬天和春天。每一次看似高蹈的技术理想面前,都悬着一把难以商业化的达摩克利斯之剑。

这次也没有例外。

浮沙上的高塔
共识可以快速形成。
ChatGPT的发布让国内市场的FOMO情绪在年初达到顶峰,团队和资金快速集结大模型。牌桌上的选手,分为:互联网创业派、大厂派,以及来自高校和研究机构的学院派。
共识也可以快速瓦解。
注定是烧钱游戏的属性,算力、数据和人才的门槛,以及当下资本市场的变化,让“大模型是否是创业公司的机会?”的诘问一直悬在头顶。
事实是在今年4月,“暗涌Waves”就注意到国内通用大模型创业潮的首战,已基本终结。这一说法后来也得到一些投资人证实,“就这些了”,此后声称要入局大模型的创业公司基本绝迹。
在一位一级市场观察人士看来,关于大模型,不光创业团队,敢下场的大基金也只有少数大名字,而且机构主要基于赌人的逻辑,前方还有漫长的证明题要做。
和傅盛论辩完的朱啸虎,第二天就在朋友圈表示,他的核心观点是:不要迷信通用大模型,因为明年GPT-3.5就成commodity(通用基础设施),而3年后,GPT-4也会是。
这背后正是关于大模型的另一重隐忧:底层的大模型本身在变,而未来很可能大量开源,或者1-2个头部厂商赢者通吃。如此一来,中国大模型创业的价值与投入就根本不成正比。
至于那个众人言说中的“比互联网更大的机会”,在戴雨森看来,立足点是“能做出可以使用工具、解决任务、分解任务的AGI”,而能实现这一点的团队,即便在世界范围内都很稀缺。
前不久,在Waves大会的一场圆桌论坛上,中国人民大学高瓴人工智能学院卢志武教授,就质疑了所谓“国产大模型的春天”。在他看来,这不过是很多公司在“微调国外底座模型”的假象。
现实也的确如此。一位AI创业者告诉我们,很多声称要做大模型的创业公司,其实从一开始就是在用Supervised Fine Tuning等快捷技术,做一个“还可以的”语言大模型出来,真正有资金和技术实力去挑战GPT4的团队和项目屈指可数。
更多创业公司开始向医疗、法律等垂直大模型以及中间层、应用层迁移。王慧文的光年之外,以及王小川的新公司,后来都选择了同时做大模型和基于模型的应用。
“42章经”曲凯发布的数据显示,以他的体感,前一段拿到融资的AI项目中,做底层模型的大概有10%-20%,做infra/中间层的有20%-30%,做应用层的有60%-70%。其中如果把还没拿到钱的也加进来,做应用的估计至少是95%+。
但垂直大模型以及应用这条路也并非坦途。对创业公司来说,垂直领域的场景和数据很难获取。而它所构建的能力又不能是通用大模型轻易覆盖的。
像infra/中间层,一位投资人曾在社交媒体上表示,旨在满足数据采集、标注、模型调度等MLOps需求的创业公司,会面临“中间商难赚差价”的夹心尴尬——前有免费开源工具,后有云厂商打包工具和服务。同时,“国内客户付费习惯仍然没有很好地养成,尤其在企业开支紧缩的经济恢复期”。
在Waves大会上,真格基金戴雨森提到,在中国做2B服务,会受到市场付费意愿、客户采购方式特点的限制。“中国互联网之前一大特点,就是要直接找用户收钱很难,很多时候都是羊毛出在猪身上。”像OpenAI和Claude在美国可以直接通过公有云卖API服务,而在中国只提供API还不够,“很多做大模型的公司针对企业客户,现在是连服务器带模型一起卖,还得提供训练和微调服务”。
上述在社交媒体发文的投资人还提到,应用层项目可以分为两种:那些垂直场景里深耕的老项目在积极接入大模型,手握数据做微调;而新项目谈格局为时尚早,在大模型的迭代能力被充分释放前,很容易“速生速死”。
这在海外市场已有表征。例如去年尚风头无两的美国独角兽Grammarly和Jasper,在GPT4发布后,现有功能即被代替,价值迅速被摊薄,朱啸虎公开称“这两家公司或将很快归零,根本守不住”。
今年3月,OpenAI发布论文开源了新模型代码:效果一步成图,1秒18张。有人因此评价“扩散模型Diffusion的时代结束了”。而此时距离后者成为2022“AIGC元年”诞生的重要技术基石,以及基于此带来许多模型的涌现,还不到一年。
所以这一波AI创业者、尤其是应用层公司,始终存在于一个左右互搏的困局里:不做,错过了是输;做了可能很快被替代,同样是输。
在Waves大会上,昆仑万维CEO方汉提到,他和中国最顶尖的产品经理交流后发现,对方还处在很懵的状态:“这一波大模型远超产品进展”。随后的独立演讲中,猎豹CEO傅盛快速反驳了这一判断:“产品经理并不懵,很多已经在行动”。但显然至今,还没有令人满意的杀手级产品出现。阿里巴巴、百度推出大模型的当日,股价均不同程度下跌。
这些特性也造成了一级市场的一种奇观:除了红杉中国、真格、源码、五源、IDG资本等机构,“机构新出手很谨慎,更多积极在促成老项目和portfolio往AI方向转,从而多出去融钱”。
在一些投AI投资人眼中,不光是模型升级问题,如果AI安全冲突——这个普罗大众更关心的问题——进一步加剧,也可能会让AI浪潮再次进入低谷,这一次的AI信仰还能持续多久?

十年AI梦
十余年来,AI风口在创投界一直回环往复地出现。
技术路线的不停演化,让这个行业充满了那种“枪出现之前,研究如何能磨一把更快的刀”以及“发现未被识别的枪”的故事。
如同深度学习路线在2012年以前被忽视一样,在AlphaGo最热的2016年,通用人工智能被业界普遍认为不可能实现。“2018年GPT1推出,在当年看来是离经叛道的路。”绿洲资本创始合伙人张津剑曾对我们描述,当时的行业主流路线是垂直模型、人工标注,“仿佛雕花”,而GPT做通用,“强行用大量数据硬怼,在学界看起来很粗鲁”。
出门问问创始人兼CEO李志飞回忆起2年前开始做大模型的经历:团队顶着很大压力,技术总监几度提出离职。而此时其实距离谷歌2017年发表Transformer模型、为通用人工智能打开了第一扇门,已经过去了三年,然而少有人识别出背后的意义。
追溯历史,从1960年代人工智能概念在学界被提出以来,仅本世纪就诞生过两次AI浪潮。
2012年,在全球最大规模的视觉识别比赛中,时年65岁的Geoffrey Hinton教授带领两名学生拿下冠军。成功来源于在一种新的AI研究范式中找到突破:以深度学习为代表的神经网络派,从此前沉寂20余年的学术边缘研究,一跃成为正统主流。
之后十年间,深度学习成为大多数人工智能企业的底层技术基础,并从学术走向产业,在视觉、语音和语义技术等领域率先应用。
在中国,语音识别领域,诞生了出门问问、科大讯飞、云知声等公司,图像识别领域,则出现了AI四小龙旷视、依图、商汤、云从以及第四范式等。
而在2016年,谷歌AlphaGo在人机围棋比赛中以绝对优势击败世界围棋冠军李世石,让“机器智慧战胜了人类”的现实,第一次在大众层面上被广泛认知。这迅速引发了全球AI军备竞赛,并很快迎来国家政策层面的支持。
在这场AI热潮中,大厂宣布All In,陆奇空降百度,腾讯、字节等相继组建AI Lab,阿里达摩院成立,马云喊出“三年投入1000亿元”的豪言。
各大科技论坛上,人们乐此不疲地探讨“奇点已来”和机器人三定律,投资人笃信,人工智能将是继蒸汽机、内燃机和互联网之后的第四次生产力革命。
彼时的创投行业正面临投资主题的缺乏(与当下不无相似),几次互联网大并购相继落幕,平台型机遇消退,巨头的触角无处不在。AI和直播短视频、共享单车等一起,接棒成为热门赛道。
AI投融资趋于狂热。有报告显示,2016年全球AI融资规模近百亿美元,相当于2000年到2013年13年间总融资额之和。一个侧面佐证是,在2016年全球股市低迷的情况下,英伟达股价依然涨了3倍。
但疲态很快显现。2019年,中国在AI领域的投资额与投资笔数大幅下降,9成AI创业公司处于亏损状态。猛烈降温开始了。
据IT桔子等数据显示,2014年至2018年,中国人工智能领域的IPO退出平均回报仅为1.83倍,2018年全年有将近90%的人工智能公司处于亏损状态。2019年,“投资人逃离人工智能”刷屏,经过几年凋敝,除联想之星、创新工场等机构外,国内真正在持续关注AI的投资人寥寥,大基金也几乎没有专人在长期覆盖。
可以说,除了少数早期投资者落袋为安,AI至今是一个没能让投资人赚到大钱的赛道。
一则至今被反复提起的投资人旧闻,或能代表其间惨烈:成立于2013年的格灵深瞳,传言公司在拿到天使轮后,徐小平在饭局上称其至少估值5000亿美元,而沈南鹏认为1000亿美元比较实际,最终妥协在了估值3000亿美元的中间数上。而现实让所有人意外,时隔9年,经历了流血上市的格林深瞳去年终登科创板,当前市值是65亿人民币(以7月6日收盘价计算)。
AI十年,至今还走在阻且长的道路上。
在旷视的首位投资人、联想之星总裁/主管合伙人王明耀看来,十年前的AI创业者处在摸索阶段,背景大多来自学术界,对变现的思考不甚清晰,加上并不成熟的产业配套,共同导致了AI商业化道路的漫长。
2011年,联想之星决定扶持三位年轻人走上创业之路,旷视当时估值仅1400万人民币。天使轮后,为避免人民币无钱可融,公司才转为美元架构。彼时资本市场的低预期,让“早年的AI创业者起步很难”。之后,旷视从CV游戏一路到相亲社交、商品推荐的尝试都不顺利,直到2015年与支付宝开始人脸支付合作。王明耀回忆,公司甚至“成立5年才拿到第一笔政府安防订单”。而今天的市场,不可同日而语。
这也让创投界对AI的又一次狂热,显得格外义无反顾。而这次技术进步最大的意义不同在于——AI第一次具备了通用的可能。
如果说过去十年深度学习的两轮AI创新,仍然是点状分布,是面向特定任务的智能、作用于垂直行业,这一轮的大模型则是李开复所说的“从孤岛到大陆”的进步:无需人工标注,模型规模大,具备跨领域能力。

技术突破对旧世界的改造是剧烈的。一位互联网投资人对我们说,新浪潮之下,像商汤、旷视这样的大公司,至少还留下了大量算力和经验储备。而对更多的AI企业来说,随着技术的演化,或将“创业未半而中道崩殂”。

回不去的旧世界
“Holy shit!”DCM董事合伙人林欣禾脱口而出。
这是22年初联系到Tiamat创始人青柑时,林欣禾第一次看到文生图效果的下意识反应。
这位亲历互联网浪潮的成功创业者,一直活跃在一线的古典互联网投资人。在对“暗涌Waves”描述当时情境时,他毫不掩饰惊讶,并坚定认为“新一代AI浪潮真的来了”,“不再以TMT时代的推荐为逻辑,而是直接替人完成所有事,人连鼠标都不用动。”
尽管对AI的投资还在迷雾中行走,甚至在短期内都将保持低沉,但这不妨碍它持续向旧世界开炮:像SaaS、出海等大量原有商业模式,面对即将被AI改写的命运。
一位长期关注企业服务的投资人认为,未来中国的SaaS公司,甚至所有2B企业,都应该是人工智能公司,软件将被智能即服务所替代。
AI一方面降低服务成本&提高人效,另一方面打通服务的流程环节。如果仍然是一家传统的软件公司,“那基本没戏了。”
风暴同样席卷原有的AI创业者,技术路线的失灵,带来的危机只会更甚:上一波基于深度学习做垂直小模型的AI公司,要么革命,要么死亡。
李志飞举例,以前很多做NLP的人,总觉得这些变化影响不到自己,“过去有PhD或教授专门研究语法解析、词性标注,未来这些中间环节都会消失”。很多从业者如今终于意识到,未来就不应该存在一个专门做机器翻译、问题回答或语音识别的工种。如果不转型,就将面临失业或工作无人关注的窘境。
在一些投资人看来,当生产力的供应结构被重新塑造,无限量的初级工程师将由AI替代。被长期作为中国商业自信叙事一部分的“工程师红利”,或将不再存在。
心识宇宙创始人陶芳波认为,面对AI,接下来只有两种人:“溺水者or淘金者”,他进而反问到:“蒸汽火车来的时候,难道只影响马车司机吗?
真格基金合伙人刘元则表示,对于投资人和创业者来说,这意味着“三五个人可以干翻大厂的机会”又重新存在了。他甚至感觉,“之前所有的积累恰好是为这一刻准备的”。
刘元在2014年入行,作为早期投资人,他“偶尔觉得有些生不逢时”:错过了移动互联网最好的2011-2012,后来的双碳、新能源、汽车等风口又极度资本密集。而突然,TMT投资人所熟悉的数据飞轮、颠覆式创新、产品思维同理心等经典理论,“好像又重新有用了”。
在访谈中,刘元反复向我们提到维特根斯坦的那句名言:“语言的极限就是世界的极限”。他说,这是AGI更令他激动的部分:如果人的思维就是一个语言过程,那文科生臆想中的世界极可能在语言大模型上实现。
目前,经过第一阶段的角逐,许多投资人们似乎更看好大厂的大模型试验。
不过,正如不久前下场大模型的幻方创始人梁文锋所言,“市场是变化的。真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。“而这或许才是创业公司的缝隙。
林欣禾在欢呼新时代到来的同时,也认为当前很多大模型有“因为缺乏应用而受阻”的可能。他类比五六年前美国AR/VR赛道的火热:谷歌眼镜烧钱无数,但至今未做出来。何况在这波AI革命中,软件尚未和硬件充分结合,“很多事情We still have to see”。
但无论如何,在林欣禾看来,ChatGPT就像一道玻璃门,一旦跨过就再也回不去了:“AI is the new internet.”
这场至今不过200天的创业潮,或许正是未来创投故事的典型样貌:道路无疑正确,但注定漫长。

36氪旗下投资报道公众号

👇🏻 真诚推荐你关注 👇🏻


来个“分享、点赞、在看”👇

中国大模型团战

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
倒在留学生枪口的华人教授,进退两难一周必读 | 名校生更能拿到offer?中小牧场进退两难,被迫杀牛...华裔少年躲厕所开公司!年仅16岁 身价直飙2000万美元阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl【今日市场】特朗普概念股DWAC狂飙22%,与美国SEC达成和解斯年智驾获新创建集团战略投资,加速布局场景物流无人驾驶|36氪首发Meta解散蛋白质大模型团队,转向商业化AI,聊天机器人或9月推出陷入两难的国民党11元一斤!奶农把奶牛当菜牛卖,中小牧场进退两难被迫杀牛这场戏完美展现了男女调情的本质|《低俗小说》深度赏析六进退两难的港漂内地中产:“不是土豪家庭就别来了”进退两难?哈利梅根想搬家被警告:会有维安问题小米:4月正式组建AI实验室大模型团队,目前AI领域人员超1200人北京内推 | 微软WizardLM大模型团队招聘NLP方向研究型实习生对话中国大模型的最早推行者黄铁军:全球可能只需要三个大模型生态idealism biggest driving forces through challenging times and he大模型速度狂飙2.39倍!清华联手微软首提SoT,让LLM思考更像人类只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型AI大模型团队Colossal-AI破局创新,火热招募中!坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」大模型可以摆脱落地难的问题吗?InfoQ 大模型技术应用创新大赛正式开启!大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例一家创业公司“赶考”大模型140天:争吵、奔跑、新内卷Doris Day/Que sera, sera俄罗斯进退两难的状况,让世人明白:1979年的邓公是多么深谋远虑再砸6亿美元,富士康却在印度进退两难|焦点分析只有在A股市场上摸爬滚打20年以上的人才知道的A股财富密码马克龙进退两难,非洲出现“反法同盟”百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报全球遏制通胀进退两难重磅!央行再出手,离岸人民币狂飙290点中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报躲在厕所“赚钱”!16岁华男拥有2家公司 身价直飙2000万美元数十家企业参编中国大模型标准;大模型创企获2.5亿美元投资;微软签署数十亿美元AI算力协议丨AIGC大事日报油画 桃林
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。