大模型之争(3):“靠技术”还是“追热点”?
近日,清华系AI初创公司深言科技(DeepLang AI)新一轮融资估值被爆约1亿美元,引发市场热议。无独有偶,搜狗公司创始人王小川创立大模型创业公司“百川智能”,称已获5000万美元资金支持。图智能公司“Fabarta”也宣布已成功获得亿元人民币Pre-A轮融资。AI大模型的一路狂飙,在资本市场迅速掀起了一股热浪。
不少投资机构选择重金押注,争做“第一个吃螃蟹”的人。然而,也有许多投资人对大模型仍持保守态度。原因无他,“大模型实在太烧钱了”。
根据中信研报的测算,ChatGPT生成一条信息的成本在1.3美分左右,是目前传统搜索引擎的3到4倍,单次搜索成本过于高昂。再看OpenAI的财报,仅是2022年这一年时间,公司净亏损总额就已达到了5.45亿美元。
除了“烧钱”的问题,专家对于国内大模型厂商是否已经做好准备依然存疑。前海信达基金董事总经理陈博指出,目前来看国内做自然语言处理(NLP)的公司还没做好转型到Transformer模型的准备。NLP是个很好的辅助工具,但不是一个能够挑大梁的盈利工具。因此个人认为现阶段大模型投资跟风和拉市值的意味比较重。
中央财经大学中国互联网经济研究院副院长欧阳日辉分析称,大模型发展的三个必要因素包括大量的数据积累、雄厚的资金以及高端的人才,三者条件缺一不可。目前来看的话,国内可能大型互联网公司更具实力,更有可能作出有益探索,但还需时日。
在大模型这个赛道上,要追技术,而不是追热点。正如微软(中国)首席技术官韦青所言,不同的土壤、不同的环境、不同的养分,长出来的树也是不同的,大模型也是如此。土壤代表着知识、文明、文化,树根代表着以Transformer为代表的“知识提炼机”,ChatGPT就是长出来的一棵树。目前在大语言模型这片土地上已经长出许多“树”了,如果只把目光放在其中一棵“树”上,那么就会永远也赶不上时代潮流。
阿里云全面接入大模型
放眼未来,卢冠男认为下一代大模型的技术关注点,一方面在于多模态模型的进展,比如探索对语音、视频等更丰富的数据格式支持;另一方面在于针对大模型的开发,应用和治理的优化,比如大型云厂商如何改善云服务,从而更好的支撑对训练和推断环节的低成本和高响应速度的算力需求。
同时,他坦言,由于客户需求还未被充分探索,且大模型自身也处在快速演进的阶段,所以短期内还无法印证是否会走向依赖通用大模型来满足各类客户需求。所以,未来的一段时间内,会见到企业专属大模型和针对各类场景定制化的大模型并存的情况。
“构建技术生态和产业生态是通用人工智能竞争的主战场。”阿里研究院副院长安筱鹏表示,“数字时代是生态的竞争,通用人工智能时代也会形成一个生态,这是生态和生态之间的竞争,是一场持久战,最后要形成一个技术和商业的闭环。”
微信扫码关注该文公众号作者