天燕大模型的发布或许也意味着,APUS在由AI掀起的技术革命浪潮中,将自己重新定位在了模型层。文|周鑫雨
编辑|苏建勋
封面来源|视觉中国
2023年4月18日,全球化移动互联网公司麒麟合盛APUS推出了自研的千亿级参数大模型“天燕大模型AiLMe”,以及针对垂直应用场景的四个模型文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”。作为一家成立近九年的全球化系统服务商,APUS是最早感受到ChatGPT引发的技术浪潮的一波企业。彼时,APUS已完成了从“出海”到“全球化”的战略更迭,大模型则是公司找到的“第二曲线”。“训练APUS累计花了将近1000万美金。”APUS创始人兼CEO李涛透露。APUS技术专家张旭在发布会上也展示了关于AiLMe的多个技术细节:在算法架构上,AiLMe与GPT一样,基于的是Transformer架构,同时模型还引入了扩散模型来生成图像等多媒体内容,构建了多模态交互的生态;在数据层面,AiLMe的训练数据主要来源于互联网公开语料库、互联网公开网页数据、APUS在服务中积累的产品数据和行业数据四个渠道;在算力层面,APUS在郑州和新加坡分别搭建了几千台服务器,为AiLMe的训练和推理提供充足的算力。缓解“算力焦虑”,这是AiLMe技术路径带给行业的启示。张旭告诉36氪,AiLMe在训练过程中并未一味地扩张参数,而是选了使用更多的数据来训练这条路:“一是对于APUS这样的中型企业而言,成本控制很重要,二是用更大规模、更高质量的数据来训练,可以用千亿的参数规模接近更大体量模型的效果。”天燕大模型的发布或许也意味着,APUS在由AI掀起的技术革命浪潮中,将自己重新定位在了模型层。在上一轮互联网浪潮中,APUS瞄准的是底层系统赛道。李涛在发布会上表示,和系统赛道一样,目前做底层大模型的公司将会经历从百花齐放,到收敛为个位数家企业的“寡头”局面,“在未来,真正好用的模型会留下,而基于模型做应用的公司将百花齐放”。在商业化层面,与多数大模型企业先toB开放API以积累行业数据,再做toC应用的路径不同,APUS先基于AiLMe,推出了问答大师、简笔成画、墨染等7款涵盖“文生文”“图生图”“文生图”等多模态交互的AI消费端产品。问答大师可用于通用问答场景,也可以选择特定领域的场景。图源:36氪测试
简笔成画可根据用户的简笔画进行艺术创作。图源:36氪测试
对此,李涛认为,对于在toC领域有丰富经验的APUS而言,在大模型赛道从toC业务切入是顺理成章的。而通过云服务、API订阅等营利的toB业务,本质上依然需要开发者在C端提供服务从而获取收入——“因此开发者只有在C端赚到钱,B端提供API服务的人才能赚到钱”。在此前36kr的专访中,李涛就提到,从商业化的现实角度来讲,国内人工智能落地有4步走:内部提效工具、现有产品进化,AI+场景重塑、构建新产业引擎。目前,APUS已经迈出了前三步。李涛认为,算力是“纸老虎”,“我们要相信未来很长时间里面,人工智能迭代实际它的算法快速改进和优化以及人工智能架构以及技术路线的迭代,可能会帮助中国在整个过程中快速大踏步追赶上,甚至可能有机会我们跟世界拉平。”
来个“分享、点赞、在看”👇