Redian新闻
>
年入10亿的创业公司怎么做大模型

年入10亿的创业公司怎么做大模型

财经


“大模型是中型公司的机会,它既有比小公司更多的资源,又有All in的决心。”


《中国企业家》记者 赵东山
编辑|李薇
‍‍‍‍‍‍‍‍
图片来源|受访者

2023年春节后,APUS创始人、CEO李涛在公司提出一项明确的要求——全员必须All in人工智能。该要求严格到,连行政人员也必须考虑人工智能如何改进自己的工作。李涛甚至提出要将员工使用人工智能的程度与涨薪挂钩。

过去的近10年中,APUS以手机系统和软件出海见长。面对老板这样的要求,一部分员工自然是懵的,他们完全不理解李涛到底要干什么,就像李涛第一次见到OpenAI创始人Sam Altman时,他本人也完全没想到会有一个如此宏大的画卷摆在面前一样。

2019年,沈南鹏率领三思院的一众创业者学员前往硅谷游学,这一行中,李涛、王小川、王兴、张一鸣等新锐企业家都在列,游学的重要行程就是拜访很多硅谷的大佬,如雅虎创始人杨致远、Zoom创始人袁征等,其中的一站,他们见到了Sam Altman。

Sam Altman当时给大家演示的案例,是人工智能在游戏场景中的应用。“当时大家听了都觉得很酷,但是没有想到它的应用场景有这么大。”李涛向《中国企业家》回忆。

时间来到2022年11月,ChatGPT的问世让李涛有种“后脖颈发凉”的感觉,“惊鸿一瞥”是他当时的感觉。

李涛惊讶地发现,ChatGPT颠覆了以往信息交互的方式,仿佛在跟一个真人在交流,可以连续追问,它用对话机器人的方式不停给你答案,它甚至知道你在想什么。而且,ChatGPT门槛极低,很多人都可以用。这些都给了李涛极强的冲击力。

从那一刻起,李涛深刻地意识到一场新的技术变革已经到来,一场新的狂欢即将开始,而作为最早意识到这一趋势的群体之一,李涛也开始了自己的大模型探索和准备。2023年4月18日,APUS发布自研的千亿参数规模多模态人工智能大模型“AiLMe”,并在近日开放公测。


曙光出现 


在亢奋地投身大模型之前,李涛身陷一种巨大的痛苦中。用他自己的话说,“找不到出路。”
过去几年,在疫情和全球局势变化等客观环境之外,李涛明显感觉到互联网时代尾声的到来,他眼睁睁地看着身边的人去炒比特币,去做加密货币,随后又加入Web3、元宇宙,转行一波接一波,在李涛看来,“本质是大家都找不到出路”。
其实,就在几年前,APUS才刚完成一次转型。
从2014年成立到2019年左右,APUS一直是一家主做手机系统和工具类应用软件开发的企业,其主要市场在东南亚等新兴地区和国家。2019年后,李涛越来越强烈地意识到,全球化就是这一代中国企业的宿命。除了东南亚等市场,还有很多发达国家市场有待挖掘,如美国、欧洲、日本、韩国等等。
然而,面对发达国家市场,势必无法再用原来的工具和系统,否则在这些市场无法得到竞争优势。为此,过去几年,APUS的组织能力建设和团队基因发生了变化,除了原来工具类的产品,李涛率领团队在内容类、交易性、社交类产品方向上做了大规模的尝试,并涌现出PickU和CutCut等小爆款。
不过,那些小的成就根本无法掩盖李涛对移动互联网红利殆尽的感伤。ChatGPT的出现,才让李涛感觉看到一道曙光。
在做内容类产品的过程中,李涛接触到大量的用户需求,仅以旗下产品CutCut所在图像领域为例,用户就会产生自动化修图、变老、变年轻、性别转化等需求,而为了满足用户的这些需求,就必须引入新的人工智能技术。借此契机,APUS完成了人工智能能力第一步的积累。
等到体验过ChatGPT之后,其所展示出的易用性和亲民性,让李涛再次意识到人工智能技术能力在这中间起到的判断和衔接作用。
2022年12月,李涛在公司内部召集了一个大模型团队,并快速立项,将重心全部转移到人工智能和大模型上。李涛还下了三个结论:第一,通用人工智能时代即将到来,而人工智能时代的操作系统就是大模型;第二,APUS一定要有大模型;第三,必须得是自己做。
今年3月,APUS专门分拆成立人工智能研究院,由研究院首席专家张旭负责。张旭本科、硕士、博士均毕业于清华大学,也是此次大模型的主力之一。
张旭告诉《中国企业家》,AiLMe采用目前业内主流的Transformer架构,同时设计了一套“插件式”架构,可以自主学习和使用“工具”,这些“工具”以插件的方式接入到AiLMe平台中。而在文本、图像、视频、音频的生成部分,AiLMe则沿用了目前业内主流的扩散模型(Diffusion Model),并继承了开源社区的生态。


急速转身


2023年4月18日,APUS发布AiLMe时,多少有点让人惊讶,因为这是继百度之后,第二个中国公司推出的大模型。

李涛告诉《中国企业家》:“背后无非两个因素,一个是意识和决心的问题,另一个是资源和能力的问题。APUS并不是因为快,而是因为早。”就像百度在2019年就推出文心大模型,李涛在2022年12月就集公司之力打造大模型。
李涛关于大模型的意识和决心,除了2019年见过Sam Altman种下的种子外,还因为在过去20多年的从业经历。
在创办APUS之前,李涛曾在大唐电信做过微波通信,之后与周鸿祎一起创业做三七二一,后被中国雅虎收购;随后他加入奇虎360担任高管,并成功推出手机安全卫士、手机助手等爆款产品。
李涛清楚地知道,一个新的技术时代对于操作系统来说意味着巨大的红利。他亲历了以windows+IE为操作系统的PC互联网时代,以及苹果+安卓为操作系统的移动互联网时代,他不忍心自己再错过即将到来的以大模型为操作系统的通用人工智能时代。
何况,在移动互联网出海时期,李涛已经用速度证明过一次自己的判断。APUS创办于2014年,李涛是最早将出海带到中国创投圈的创业者之一。那时,基于Launcher桌面系统、清理安全、加速等工具类产品,APUS实现了“上线1个月超千万,6个月破亿”的增长成绩。
谈到资源和能力,APUS虽然不如大厂的资金雄厚,但李涛认为,“人工智能大模型是中型公司的机会,因为它既有比小公司更多的资源,又有All in的决心。”
李涛透露,目前APUS年收入在超过10亿元人民币的规模,公司账面上也趴着10多亿元现金。此外,目前APUS在全球用户量已超24亿,覆盖200多个国家和地区。
此外,APUS动作够快的另一重因素是,采用了开放的研发模型。在APUS人工智能研究院之外,APUS还跟中科院、清华大学、南洋理工大学、香港理工大学等高校实验室形成开源的项目组,让大模型的搭建快速落地。

高质量的数据比算力更重要


李涛将影响大模型质量的要素分为4类:算法、算力、数据和场景。在他看来,如果将决定大模型效果的因素按照重要性来排序,应该为:训练数据质量>训练数据规模>参数规模。

在技术路线上,APUS采用大参数和大数据来训练中等规模模型。

“AiLMe是1000亿参数的模型,但背后的数据其实是2.2万亿的token,他们原来都是追求所谓大参数,APUS在训练上略有不同,我们的场景依赖度会更高。”李涛告诉《中国企业家》。

为解决算力问题,APUS在郑州和新加坡分别建设了两大智算中心,在自建GPU服务器算力外,APUS还跟腾讯、阿里、亚马逊等服务商进行租用和采购,与第三方的算力协同作用。

在数据方面,APUS大模型的数据来源有4个:第一,公开的行业数据;第二,互联网的公开数据;第三,专门用于训练人工智能的数据集;第四,真实的用户需求数据,即每天有上百万人在使用产品时产生数据和互动,该部分在模型训练里的权重也非常高。

在李涛看来,ChatGPT的震撼一半归功于OpenAI团队,另外一半得归功于全球的用户,因为是全球的用户打开了ChatGPT的想象空间,开启了思维模式。

相比大家对算力的焦虑,李涛更看重高质量的数据。

“这通常是真实用户的真实需求和问题,我们都脱敏过,不会涉及数据隐私安全,更关注用户的问题和需求,至于你是谁并不重要。”李涛解释,比如,APUS旗下“智能问答大师”产品每天产生几十万的用户问题,这些都可以用来训练数据和模型。

针对具体应用场景,APUS从AiLMe大模型内蒸馏出文本、图像、视频、音频四个垂直领域精炼模型,并基于此开发出直接面向用户的智能问答大师、简笔成画、墨染、Star Night、KJV Bible Now、PicPik等AI产品。

在李涛看来,应用场景最大的好处是两个,一,提供高品质的数据;第二,提供实时的数据。

在商业模式上,李涛采用短期to C、中长期to B的模式。他认为,to C很容易形成闭环,用户自发付费,更灵活也更有弹性。但中长期一定是to B,因为一家公司所能覆盖的场景一定是局限的,需要更多的行业伙伴共同建构。未来它将无处不在,所有的服务都要用到它,整个市场将是10万亿美元以上的规模。

与此同时,李涛还预言,未来很多行业服务都要通过在大模型基础上蒸馏出精炼模型来支撑,而不是用大模型全局支撑,因为这样成本太高了,一个大模型会蒸馏出若干个经验模型,用来支撑不同的服务。

从春节到现在,APUS内部员工从部分人不解、一些人不信,到慢慢地大家都去尝试,一切都在悄悄发生变化。如今,APUS几乎所有的员工已经有了采用AI工具的意识,李涛也提出了“如果员工借助AI提效30%涨薪10%,提效50%涨薪20%,提效50%以上涨薪30%”的允诺。

在此背景下,APUS内部正在分成三批人:一批人专注做大模型;一批人专注把大模型用到C端产品上;另一批人就是职能部门的员工,可以采用任何AI产品。内部员工的产品选择,也正形成一种隐形压力,比如李涛可能会问:“你看同事都不用你的产品,你是不是得努力?”

过去的20多年,李涛亲历了360的起伏,也见证了字节跳动、美团等新巨头的崛起,他直觉判断通用AI大模型会成为未来20年的主流,“这是一场全新的技术革命,既然我都看到了,就必须要跑在别人前面。”

过往的经验告诉李涛,任何技术变革前期都是巨大红利期,也是对社会创造价值最多的时间窗口。“对于做企业的人来说,永远要捕捉这个时代的潮流。”李涛表示。

新闻热线&投稿邮箱:[email protected]


END 

值班编辑:李薇  审校:张格格  制作:张怡然

‍‍‍‍‍‍‍‍‍‍‍

关注“中国企业家”视频号


看更多大佬观点和幕后故事


[ 推荐阅读 ]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl坚持做行业大模型,竹间智能给大模型造了一座「模型工厂」你不知道的蚊蝇生意:成本几毛,年入10亿周鸿祎:中小企业能不能做大模型?中国团队自动驾驶大模型斩获CVPR最佳论文;Stability AI推出新文生图模型;京东大模型即将发布丨AIGC大事日报傅盛:大模型的弱点,才是我们的创业机会AI大神贾扬清离职阿里首次受访:创业为什么不做大模型(上)| 硅谷徐老师记忆中的南京之十五:重访故地【吐槽大会】《愛人》我回台湾一周的好消息与坏消息百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报大模型变“小”:黑马天启开创AI模型“重度垂直”新思路,入选北京大模型行业应用典型案例斯坦福博士独作!大模型训练速度再翻倍,还官宣加入明星创业公司当首席科学家5平小店,年入10亿!饺子界的瑞幸,被广东人捧红了大模型时代,解析周志华教授的「学件」思想:小模型也可做大事性能超越Llama2-13B,可免费商用,姚星创业公司开源百亿参数通用大模型苹果被曝研发聊天机器人;传抖音社交负责人转做大模型;斯坦福研究发现GPT-4“变笨”丨AIGC大事日报一家创业公司“赶考”大模型140天:争吵、奔跑、新内卷曾干出年入12亿公司,创业老兵又杀入1.5万亿赛道:VC一听直接打钱靠卖鱼虾年入10亿,这对父子第三次冲击IPO3.5万亿的特斯拉VS7000亿的比亚迪:总归有一个不太对2023各大航班排行榜,最佳vs最差,你常坐的航空公司怎么样呢?(文末有中奖名单)字节的野心:做大模型时代的“军火商”对话竹间智能简仁贤:做大模型不能唱高调,企业需要低成本、平民化的模型产品《绿色的牧歌》&《怎么了》只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型高位截瘫,仍年入10亿!广东的硬汉老板,坐轮椅硬刚大牌传OpenA正测试DALL·E 3模型;华为语音助手支持AI大模型;亚马逊组建AI大模型新团队丨AIGC大事日报不学ChatGPT!加拿大创业公司Cohere再获投资,跻身20亿美元独角兽别拿医生不当劳动力 (2)字节的野心:做大模型时代的「军火商」一览科技CTO陈锡言:大模型阴影下的技术创业机会——链接大模型与用户|量子位·视点分享回顾租2000张芯片做大模型:一家创业公司的生死抉择励志!中国男子不想为日本人工作,远赴澳洲创业!从难民到年入$4.9亿的Bing Lee帝国
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。