年入10亿的创业公司怎么做大模型
2023年春节后,APUS创始人、CEO李涛在公司提出一项明确的要求——全员必须All in人工智能。该要求严格到,连行政人员也必须考虑人工智能如何改进自己的工作。李涛甚至提出要将员工使用人工智能的程度与涨薪挂钩。
过去的近10年中,APUS以手机系统和软件出海见长。面对老板这样的要求,一部分员工自然是懵的,他们完全不理解李涛到底要干什么,就像李涛第一次见到OpenAI创始人Sam Altman时,他本人也完全没想到会有一个如此宏大的画卷摆在面前一样。
2019年,沈南鹏率领三思院的一众创业者学员前往硅谷游学,这一行中,李涛、王小川、王兴、张一鸣等新锐企业家都在列,游学的重要行程就是拜访很多硅谷的大佬,如雅虎创始人杨致远、Zoom创始人袁征等,其中的一站,他们见到了Sam Altman。
Sam Altman当时给大家演示的案例,是人工智能在游戏场景中的应用。“当时大家听了都觉得很酷,但是没有想到它的应用场景有这么大。”李涛向《中国企业家》回忆。
时间来到2022年11月,ChatGPT的问世让李涛有种“后脖颈发凉”的感觉,“惊鸿一瞥”是他当时的感觉。
李涛惊讶地发现,ChatGPT颠覆了以往信息交互的方式,仿佛在跟一个真人在交流,可以连续追问,它用对话机器人的方式不停给你答案,它甚至知道你在想什么。而且,ChatGPT门槛极低,很多人都可以用。这些都给了李涛极强的冲击力。
从那一刻起,李涛深刻地意识到一场新的技术变革已经到来,一场新的狂欢即将开始,而作为最早意识到这一趋势的群体之一,李涛也开始了自己的大模型探索和准备。2023年4月18日,APUS发布自研的千亿参数规模多模态人工智能大模型“AiLMe”,并在近日开放公测。
曙光出现
急速转身
2023年4月18日,APUS发布AiLMe时,多少有点让人惊讶,因为这是继百度之后,第二个中国公司推出的大模型。
高质量的数据比算力更重要
李涛将影响大模型质量的要素分为4类:算法、算力、数据和场景。在他看来,如果将决定大模型效果的因素按照重要性来排序,应该为:训练数据质量>训练数据规模>参数规模。
在技术路线上,APUS采用大参数和大数据来训练中等规模模型。
“AiLMe是1000亿参数的模型,但背后的数据其实是2.2万亿的token,他们原来都是追求所谓大参数,APUS在训练上略有不同,我们的场景依赖度会更高。”李涛告诉《中国企业家》。
为解决算力问题,APUS在郑州和新加坡分别建设了两大智算中心,在自建GPU服务器算力外,APUS还跟腾讯、阿里、亚马逊等服务商进行租用和采购,与第三方的算力协同作用。
在数据方面,APUS大模型的数据来源有4个:第一,公开的行业数据;第二,互联网的公开数据;第三,专门用于训练人工智能的数据集;第四,真实的用户需求数据,即每天有上百万人在使用产品时产生数据和互动,该部分在模型训练里的权重也非常高。
在李涛看来,ChatGPT的震撼一半归功于OpenAI团队,另外一半得归功于全球的用户,因为是全球的用户打开了ChatGPT的想象空间,开启了思维模式。
相比大家对算力的焦虑,李涛更看重高质量的数据。
“这通常是真实用户的真实需求和问题,我们都脱敏过,不会涉及数据隐私安全,更关注用户的问题和需求,至于你是谁并不重要。”李涛解释,比如,APUS旗下“智能问答大师”产品每天产生几十万的用户问题,这些都可以用来训练数据和模型。
针对具体应用场景,APUS从AiLMe大模型内蒸馏出文本、图像、视频、音频四个垂直领域精炼模型,并基于此开发出直接面向用户的智能问答大师、简笔成画、墨染、Star Night、KJV Bible Now、PicPik等AI产品。
在李涛看来,应用场景最大的好处是两个,第一,提供高品质的数据;第二,提供实时的数据。
在商业模式上,李涛采用短期to C、中长期to B的模式。他认为,to C很容易形成闭环,用户自发付费,更灵活也更有弹性。但中长期一定是to B,因为一家公司所能覆盖的场景一定是局限的,需要更多的行业伙伴共同建构。未来它将无处不在,所有的服务都要用到它,整个市场将是10万亿美元以上的规模。
与此同时,李涛还预言,未来很多行业服务都要通过在大模型基础上蒸馏出精炼模型来支撑,而不是用大模型全局支撑,因为这样成本太高了,一个大模型会蒸馏出若干个经验模型,用来支撑不同的服务。
从春节到现在,APUS内部员工从部分人不解、一些人不信,到慢慢地大家都去尝试,一切都在悄悄发生变化。如今,APUS几乎所有的员工已经有了采用AI工具的意识,李涛也提出了“如果员工借助AI提效30%涨薪10%,提效50%涨薪20%,提效50%以上涨薪30%”的允诺。
在此背景下,APUS内部正在分成三批人:一批人专注做大模型;一批人专注把大模型用到C端产品上;另一批人就是职能部门的员工,可以采用任何AI产品。内部员工的产品选择,也正形成一种隐形压力,比如李涛可能会问:“你看同事都不用你的产品,你是不是得努力?”
过去的20多年,李涛亲历了360的起伏,也见证了字节跳动、美团等新巨头的崛起,他直觉判断通用AI大模型会成为未来20年的主流,“这是一场全新的技术革命,既然我都看到了,就必须要跑在别人前面。”
过往的经验告诉李涛,任何技术变革前期都是巨大红利期,也是对社会创造价值最多的时间窗口。“对于做企业的人来说,永远要捕捉这个时代的潮流。”李涛表示。
新闻热线&投稿邮箱:[email protected]
值班编辑:李薇 审校:张格格 制作:张怡然
关注“中国企业家”视频号
看更多大佬观点和幕后故事
[ 推荐阅读 ]
微信扫码关注该文公众号作者