大模型下半场,已无公司可投
一个不争的事实,大模型领域已经到了无公司可投的地步。
-----------------------
投资人最难的时刻已经到来——看得上的投不起,投得起的看不上。
一个不争的事实,大模型领域已经到了无公司可投的地步。
5月,李彦宏那篇刷屏的著名演讲《大模型改变世界》还历历在目,然而不到一个月的时间,就爆出了以ChatGPT为代表的通用大模型,开始出现访问量下降的情况。
一方面是用户对AI热度的降温,属于情理之中,另一方面也说明,整个行业开始趋于理性。
然而,这个赛道的创业热情却远未止步。
拥挤的赛道,容不下千军万马
尽管前有百度的文心一言,后有京东的言犀,华为的盘古,科大讯飞的星火,巨头扎堆的大模型领域,依然阻挡不了国内创业公司前仆后继的脚步。
据科技部下属的中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月28日,国内规模在10亿级参数以上的基础大模型,至少已发布79个。我国研发的大模型数量已经排名全球第二。
有没有嗅到熟悉的味道?同样的故事上一次叫元宇宙,上上次叫区块链。
这种爆款故事的脚本,发展到这个阶段大抵是:一方面创业者的融资进展并不顺利,另一方面,新公司、新产品又不断挤向赛道。
据不完全统计,包含通用与垂直、开源与闭源不同类型在内,国产大模型数量已超百家。
其中,不乏黑马、小巨头、明星、独角兽的存在。
MiniMax一度被称为国内目前大模型创业潮中估值最高的创业公司。今年4月,36氪报道,Minimax正在以超十亿美金的价格进行新一轮融资。有接近人士透露,“所有老股东都超额认购,而新股东大概有四五家”。而此前Minimax就曾完成过两轮融资,入局的投资方包括米哈游、高瓴创投、IDG资本、云启资本、明势资本等。
除此之外,受到一级市场投资人关注的大模型公司还包括:王慧文的光年之外、智谱AI、杨植麟的新公司、沈向洋的新公司等。据市场消息,国内最早下场的一支团队,走轻量化路线,也已直奔10亿美金估值而去。
万马奔腾的局面,导致赛道拥挤是合情合理之事,好项目占据绝大部分的大模型赛道,剩下的99%的创业公司将开启资源争夺战。
这两年,投资方和创业者各有各的难处,在美元基金逐渐撤退渐远的境况下,投资方也出现了钱少不热的情况。
据悉,一家数月前宣布入局大模型的初创团队,在与资方的洽谈中并不是一帆风顺,目前对外报价已经压至1亿美金之下,远低于最初预期。
△图片资料来自量子位根据公开资料整理,仅限2023年
如图所示,把钱用到刀刃上,大模型发展近半年,坐上牌桌的投资方,投资取向也异常明确。
第一,认准头部。
典型例子是过去半年中,出手最为频繁的几家,如以腾讯投资为代表的大厂战投/风投,或自身在赛道上一路飞驰的智谱AI。
对它们而言,鸡蛋既不会放在同一个篮子里,也不会放在太多篮子里,更不太会放在头部梯队以外的篮子里。
第二,圈死某一家被投企业。
比如汤姆猫对西湖心辰的一路加码,知乎对面壁智能的持续看好,甚至自己的合伙人、CTO出任对方董事兼CEO等等。
在粮草不足的情况下,优质项目理应是最先吃到肉的孩子,对那些等待突围的孩子而言,投资方的态度也不容乐观。
狂热不在,投资方态度保守
随着大模型领域的飞速发展,现实的问题也搬上台面,甭管你是什么型,核心都绕不过两个问题:
其一,训练用的高质量数据从哪儿来?
第二,训练后的大模型用到哪儿去?
前者是个技术难题。
数据不但要高质高量,还要合理合法,面对这个量级的数据,不仅要有复杂度上天的ETL,还需要配备大量的算力,最后还要考虑如何再将大模型部署到线上保证性能。
后者是个变现难题。
好不容易训练成功的大模型,找不到应用场景,相当于白玩。
这两大难题,也成为投资方出钱的重要衡量标准,这让投资方的出手更为保守。
今年,已经完成4轮融资的一流科技屡屡融资不顺,差点倒在AI 2.0浪潮兴起之前;而王慧文自立山头,急需引入行业资源增强竞争力量,为“打造中国OpenAI”储备力量。
后来的故事大家都知道了,王慧文因病隐退,一流科技随光年之外归入美团麾下。
王慧文激流退场的意外,在某种程度上也反映出大多数投资机构的保守态度。
不少一线投资人曾经吐露,看了很多的项目,也聊了很多项目,但最终锚定的标的却寥寥无几。
如上文所言,资本集中押注,狩猎目标集中在3-5个选手身上,通往成功的机会被极限压缩了。
马太效应的加剧,让有望突围的创业公司数量进一步缩小,但纵观市场上叫得上名字的公司,要价都扶摇直上。
就算对“AI 2.0时代有比互联网大10倍的机会”深信不疑,但是否值得如此高昂的价格,依然是一个问号。
毕竟拉起队伍后,大模型商业模式不明确,盈利点不清晰,许多创业项目还停留在概念验证阶段。
到训出大模型、拿出真产品,甚至赶上GPT-3.5,赛道上的国内选手们还有很长的路要走。
甚至于,部分投资人干脆放弃看大模型项目,转向infra层面看芯片、看硬件的老路。
观望,等待应用层机会浮出水面?
部分投资人们举棋不定不敢轻易尝试,还没买到入场券的,有的在观望,会不会在开源领域出现比LlaMA-2更厉害的模型,让大家都没得玩?
还有的在等应用层的机会。
只不过就回到之前朱啸虎和傅盛在朋友圈的争论,对于know how略显单薄的应用层而言,“有没有创造价值,大家都心知肚明的,不要太高期望值就好。”
以及,实际情况中,自身根本建立在别人提供的API上,对创业公司是否不太友好?
在这样的高呼声中,人们心中的疑虑加剧:
真的能在短时间内做成吗?做出后,效果离GPT-4还差多远?有一定的实力,能找到合适的商业化落地场景吗?投入与价值是否真的成正比?
本来没出手的投资方,似乎更不着急了。
8个月前,ChatGPT一石激起千层浪;6个月前,国内的大模型赛道开始备受瞩目,热度逐渐如日中天。
到现在,想走大模型路线通向AGI的人依旧络绎不绝。
头号玩家们每周仍然要见数不清的投资者,梯队前列公司的估价持续走高,新兴的后起之秀还在源源不断奔向赛场。
同时面对的还有更为冷静和严苛的评价目光,来自投资人,来自业界,还来自自身——且多少带着与日俱增的质疑。
大火热炒半年,大模型身下燃烧的大火开始转向小火模式,在年初“宣布入局”和年底“模型/产品问世”之间的这段空隙,种种迹象表明,大模型创投界渐渐迎来了第一波冷静期。
END
微信扫码关注该文公众号作者