面壁智能李大海:第四次创业,如何跟大厂PK财经2023-10-31 05:10大模型创业进入应用落地“内卷”阶段。文|《中国企业家》记者 孔月昕编辑|马吉英头图摄影|邓攀“8月初,我们还在对面那栋办公楼里,当时团队只有40多人,现在我们已经搬到这来了,因为那边座位坐不下了。”10月底接受《中国企业家》采访时,坐在海淀区科建大厦办公室里的李大海这么评价面壁智能的发展状态,“创业公司经常因为座位不够搬家,所以我觉得现在公司发展得还不错。”李大海于今年6月担任面壁智能联合创始人、CEO,主要负责面壁智能战略发展和日常运营管理。这是他的第四次创业,也是他第一次担任创业团队的一号位。2006年大学毕业后,李大海便加入Google成为Google中国创始员工之一;四年多后,他和时任Google北京工程副院长的刘俊一起创业,做出了国内第一个社会化搜索引擎“云云网”。之后,他又加入豌豆荚,负责搜索业务。2015年,李大海加入知乎,担任联合创始人、执行董事和CTO。持续兴奋、偶尔焦虑——加入面壁智能以来,这种痛并快乐的情绪一直伴随着李大海。面壁智能是国内最早从事大语言模型的团队之一,核心科研成员来自于今年大模型创业浪潮中的“半壁江山”——清华大学NLP实验室,联合创始人刘知远是清华大学计算机系长聘副教授、智源青年科学家。今年年初,在ChatGPT席卷科技圈后,时任知乎CTO的李大海觉得不能错过这次技术变革带来的机会,深入调研后,知乎决定与面壁智能合作。4月,知乎宣布对面壁智能进行天使轮投资,并陆续发布了共研的知乎大模型“知海图 AI”、基于大模型的对话产品“面壁Luca”等。随着“百模大战”逐渐进入尾声,关于大模型的商业化模式也成为创业者和投资人关注的重点。对于AI创业公司而言,单纯的大模型没有商业模式,或者说商业链路很短;而纯应用没有竞争壁垒。因此,国内外的生成式AI领域投资人和创业者都变得更为“冷静”。据清科数据统计,今年Q3,该领域国内外融资交易数和金额都大幅下降。这种情况下,公司只有将模型和应用结合起来形成数据飞轮,才更加靠谱。今年下半年,面壁智能在迅速推动大模型的落地和商业化,同时,公司也在推进新一轮的融资。李大海预计,明年会是大模型或AIGC(生成式人工智能)应用广泛落地的一年,因此,公司希望在保持模型技术能力领先优势的同时,也能产出很好的应用,获得显著的用户规模增长。以下为李大海的采访整理,有删减。大模型下半场开启,做AIGC的“造车厂”当以ChatGPT为代表的大语言模型面世后,作为创业者,第一反应都是兴奋。这一技术变革的背后,代表着AGI(通用人工智能)时代可能降临。因此我们可以看到,AIGC创业的第一阶段,大家都在探讨怎么能训练出更好的模型,并且上半年各家公司都在发布自己的大模型。面壁智能早在2020年就开始做模型的训练。国内最早的GPT结构的中文大模型——CPM-1,就是面壁智能核心团队研发的。国内的“百模大战”也导致大众对于AIGC的理解,大部分也还停留在ChatGPT这个面向C端的出圈产品或者大模型“混战”阶段。但实际上,这一轮AI浪潮早已经进入了头部(公司)模型基本可用的状态,现在业内是从技术驱动转向应用驱动的“下半场”,也就是如何把大模型的应用做出来。大模型想要落地到具体场景,AI Agent(自主理解、规划决策、执行复杂任务的智能体)是重要路径,它代表的是比“裸”模型更拟人的使用体验。我们判断未来会是Agent的世界,万物都是Agent。比如电饭锅可以是Agent,放入食材后,我们跟它说要熬粥,它就会根据熬粥的逻辑,去设定相应的加热方式。冰箱也会是Agent,如果它的冷却剂漏了,它会跟我们对话,说自己需要维修了,或者它已经打完了维修电话,通知维修师傅上门时间;或者提醒我们上周蔬菜买多了,要赶紧吃掉,否则菜就坏了。基于此,我们对于未来世界也有一个概念——IoA,即Internet of Agents。面壁智能的定位也由此确定,我们是一家基于大模型Agent技术的公司,技术研发方向从模型基座到Agent技术,再到最终的应用。因此,在大语言模型研发的基础上,我们进行了Agent框架的研发,我们内部称之为AI Agent 的“三驾马车”。第一驾马车是大模型驱动的智能体通用平台AgentVerse,其中有各种各样的AI专家,可以组合成“工作组”,共同帮助用户解决复杂任务。第二驾是基于AgentVerse的多智能体协作开发框架ChatDev,它可以应用到更具体的场景,如软件研发等。其中有一些已经预定好的固定角色,如判断用户需求的CEO、技术研发的CTO、写程序的programmer、产品设计designer,以及tester等,每个角色都有固定的工作职责。第三则是超强AI智能体应用框架XAgent,它的定位是一个“ AI特工”,可自己拆解处理复杂任务,简单来说就是超强的单体智能。在我看来,随着整个社会数字化、信息化和智能化的开展,各行各业都需要在IT方向进行投入,这意味着社会对于工程师的需求会越来越大。大模型以及Agent技术一旦可以实际应用,就可以提升程序员或者工程师的能力边界,进而极大提升他们的工作效率。未来可能就是工程师去做构思,理解市场需求,然后将需求拆解交付给AI,让AI去完成一些低水平的重复劳动,解放人的生产力。这有助于未来千行百业都能把AI相关软件应用起来,进而更好地推行全面数字化和信息化。来源:视觉中国基于这种设想,我们现在更关注模型跟应用结合产生的综合效果,给用户提供更好的体验。通俗理解,我们现在更像一家“造车厂”,我们自己做引擎,同时要把引擎放到自己的车里,让它能够跟所有的部件组合在一起,让车跑得更快,用户开车时更稳更安全。目前,面壁智能在技术上走得很快,我们是国内最早一批在技术上实现这一能力的公司。通过我们的ChatDev,一位普通用户只需要一杯可乐的时间,用不到一美元的成本,就能做出来一个小软件。如果将AI智能时代类比移动互联网时代,大模型就相当于安卓系统,我们目前处于安卓系统的更上层的一个比较体系化的技术突破状态。创业公司面临商业化难题:to B还是to C作为一次非常重要的技术革命,大模型的影响会扩大到千行百业,也就是社会的方方面面。那就意味着,to C和to B两个领域势必都会受到影响,并在此基础上进行换代升级。进入AI竞争的下半场,各家公司在商业化落地时,都面临to B、to C两个路径选择。但在我看来,两条路都要走。年初时,大家表示大模型可以把所有事情重做一遍,也就是将现存的各种系统和产品进行改造。这意味着大模型对于各种各样的企业都有价值,因此创业公司的商业化方式,应该是给其他企业提供大模型,让它们能从中受益,推动业务快速发展。我认为这是to B业务的基础逻辑。在to C领域则有一个基础概念:任何一次技术的革新,如移动互联网、图形界面等,它都会带来新的人机交互模式,而基于这个模式会有全新应用,即原生应用。移动互联网时代产生了移动互联网时代的原生应用,同理,AI时代一定会有AI的原生应用,我们相信AI原生应用会有非常大的想象力,而且我们认为存在巨大的商业机会。在我看来,AI原生会产生一些之前不存在的产品,正因为这个场景一开始不存在,所以它刚出现时可能很小,相比于资源更丰富的大公司来说,创业公司更容易看到这些“风起于青萍之末”的“末”;并且大公司受评估体系或决策机制等因素影响,它们的决策链条也更长,即使先发现了,在流程上可能也会慢一步。因此想要抓住C端市场,创业公司需要有更敏锐的视角,更创新的能力,发掘一些新的场景。很多公司选择优先做to B业务的逻辑也可以理解。主要在于to B行业,尤其是垂直领域的需求更具体,更容易落地,需求量也更大。这对于创业公司来说机会更多,因为蛋糕很大,大家可以一口一口地“吃”,都有机会去服务足够多的客户。不过,B端市场同样存在不可忽略的问题,即中国的to B业务非常碎片化,每个企业的需求都不太一样。所以即使是做大模型的配套应用,依旧需要早期详细沟通、了解客户需求,进行个性化定制。尽管我们公司的战略是to B、to C两条腿走路,不过现阶段,面壁智能更侧重C端。一方面,在公司的组织能力上,目前面壁智能的基因更偏向to C,所以在to B业务上,我们倾向于选择擅长跟客户沟通、交付能力强的合作伙伴,我们去提供平台、工具,合作伙伴去做好交付落地工作。例如我们在上海的一家战略合作伙伴,他们就是在金融领域去进行面壁智能大模型的商业化交付,我们给他们提供底层的模型和训练平台。在这个合作链条中,我们只要把各自擅长做的事做好,就能一起给客户产生价值。另一方面,过去几年里,to B创业曾经是国内的一个风口。当时大家看到了国外to B市场的繁荣,是中国的N倍,觉得中国的B端市场应该可以发展起来了,当时兴起了大批SaaS创业公司。实际上,国内也没有产生这么大体量的企服市场。大模型出现后,基于国外市场逻辑,OpenAI的API业务发展非常顺利,推进得也很快;参考市场环境,中国的API业务应该不会发展得太快。并且,基于中国商业市场的发展习惯,随着行业发展,“卷”也会成为大模型to B领域未来发展的必然趋势。AI创业公司如何去适应并应对,也成了未来的重要课题。这种情况下,AI创业公司首先要提高技术能力,把行业天花板做高,通过不断推出更好的模型,给客户更好的效果,实现效果取胜。其次,团队要有足够高的效率,效率决定了企业在竞争里面以什么样的成本、什么样的服务价格去拿到客户。我们希望在智能时代里面,面壁智能成为大家提到AGI就能想起来的公司。这是我们的长期愿景。新闻热线&投稿邮箱:[email protected]。END 。值班编辑:郭立琦 审校:张格格 制作:董斌关注“中国企业家”视频号[ 推荐阅读 ]微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章