“这一波大模型浪潮,与十年前移动互联网元年的样子很像。”
7月6日,在上海举办的一场AI Hackathon上,主办方告诉雷峰网。十年前,当移动互联网兴起的时候,各互联网公司及相关机构时常组织类似的编程比赛,只要开发者愿意,几乎每天都可以有 Hackathon 参加。大模型浪潮到来后,以AIGC为主题的 Hackathon也开始遍地开花。但这场 Hackathon 略有不同:在WAIC大会7月7日的“MaaS:以模型为中心的AI开发新范式”论坛现场,前排最好的位置预留给了参加 Hackathon 比赛的队伍代表。毫无疑问,主办方希望向开发者们传达一个信号:你们是这个论坛最重要的人。这场 Hackathon 的主办方是中国最大的AI模型社区“魔搭”,论坛的主办方是中国云计算领域的领导者阿里云。在现场,阿里云CTO周靖人在开场演讲中表示:“阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,并在资金和商业化探索方面提供充分支持。阿里云魔搭社区现已聚集180万AI开发者和由20多家顶尖人工智能机构贡献的900多个优质AI模型,我们将努力把魔搭社区培育成中国最大的‘大模型自由市场’。”周靖人在WAIC现场
阿里云的野心,是在MaaS时代缔造一个全新的大模型生态。
当科技不断发展进步,最先行动起来的是那些拥有技术和产品背景的年轻的创业者们。ChatGPT向他们展示了一种通过简单的对话交互方式调用AI强大能力的可能,让他们看到了AIGC未来的无限可能性。开发者们能感受到技术变革的来临,但如何降低大模型研发门槛、实现大模型落地应用,他们尚未看到答案。对于他们来说,要想从“开发者”变为“创业者”,算力成本、数据场景的匮乏与落地的不确定性是几大关键因素。由于基础大模型对技术和成本的超高要求,国内能做通用模型创业的公司和团队是少数。当前创业公司的方向主要可以分为两类:一类是与通用大模型厂商合作定制、或是基于开源基础模型之上,基于行业Know-How训练自己的模型算法;另一类是做应用型服务,在通用模型或行业大模型之上做AI产品。无论哪一条路线,创业公司的行业大模型和AI工具的研发都离不开通用大模型的能力。但现实的情况是,国内大模型成果虽多,但每一家的模型参数、侧重能力、配套设施等均不相同,能力也良莠不齐。不仅如此,有些厂商提供的模型覆盖面比较有限,面对一个创业公司、多个服务场景的定制化服务时,需求难以被满足。开发者和创业者面临的另一大问题是:好的工具和服务太少。从模型搜索、调用、精调、定制到产品化开发,整个链路都缺少“开箱即用”的工具。这也是AIGC声浪巨大,但真正的创业浪潮却并未爆发的原因。创业者的每一个需求和反馈都十分紧迫,但面对现实,沸腾的从业者们也不得不被迫进入冷静期。如何让大模型的基础能力在生产环节更好地释放?作为业内最早布局大模型的科技公司之一,阿里云对此有先人一步的思考。2022年,阿里云CTO周靖人在业内首次提出MaaS(Model as a Service)“模型即服务”理念。不到一年时间,探索以模型为中心的AI开发范式已成行业共识。阿里云率先落子,围绕AI模型这个中心,重新设计云计算的技术和服务架构,试图让云服务覆盖大模型从研发到落地的整个周期。为了让AI开发者能够更高效地查找使用模型,阿里推出了AI模型开源社区魔搭(ModelScope),以模型为纽带,链接起AI模型的生产者和使用者。魔搭社区现已集聚180多万AI开发者和900多个优质模型,涵盖IDEA研究院、澜舟科技、清华TSAIL、智谱AI等国内大模型赛道核心玩家贡献的优质模型。平台现有10亿以上参数规模的大模型约100个,是名副其实的中国大模型第一门户。建成一站式的AI模型门户后,下一步要帮助创业者和开发者把模型用起来。周靖人曾说,MaaS要解决的核心问题是让模型使用更简便。为此,魔搭平台推出了一系列的模型开发工具和服务。比如,魔搭社区打通了与阿里云灵积服务平台的部署链路,支持社区的模型通过灵积来实现服务化。灵积拥有模型上云统一工具链路,支持模型的自主接入,所有接入灵积平台的模型都能自动获取阿里云的强大服务能力,包括基于阿里云强大算力的跨区域自适应弹性能力。本次人工智能大会,社区又上线一款新工具——ModelScopeGPT(魔搭GPT)。用户在前端用自然语言发出指令,ModelScopeGPT就能借助作为“中枢大脑”的大语言模型,调用魔搭社区其他AI模型,通过大小模型协同,完成人类布置的多种模态融合任务。这是继AutoGPT、HuggingGPT等“大模型调用工具”兴起以来,国内推出的首个智能工具。阿里云表示,构建ModelScopeGPT的数据集和训练方案将会对外开放,供开发者自行调用,开发者可以根据需要对不同的大模型和小模型进行组合。ModelScopeGPT是阿里云MaaS范式在模型使用层的重要映射:将大模型及模型工具在“模型自由市场”开放,帮助开发者多、快、好、省地使用大模型。对大模型创业公司和开发者来说,这些工具就是大模型掘金人的“铲子”。1912年,创新理论的鼻祖熊彼得在《经济发展理论》一书中写道:“任何经济结构都可以拆解为技术、产品、组织、市场、资源五个要素。将这些旧要素重新组合,便可以称为‘创新’。”MaaS时代,阿里对上述要素重新组合、交出的答卷是:打造MaaS的生态,帮助整个行业降低成本,从而激发群体创新力。从历史来看,这种“以生态换创新”的做法,多次被证明是有效且最能释放创新红利的方法。对很多人来说,大模型的到来属于“横空出世”。对技术人来说,一切不过是AI技术发展至今“水到渠成”的事。周靖人曾说:“我们行业内的人并不认为这条道路(大模型)是2023年突然出现的,这是一个长期以来技术发展的演进过程。”同样,MaaS理念,也是阿里云在云计算和AI领域多年深耕后水到渠成的结果。拍摄于展区
阿里云早在2019年就开始研发大模型,在超大模型、语言及多模态能力、低碳训练、平台化服务、落地应用等多个方面,都对中文大模型发展做了很多前沿性、引领性的工作,积累了丰富的大模型研发经验。
基于对大模型研发和落地需求的理解,阿里云搭建了一套适配AI时代的算力基础设施。阿里云拥有国内最强的智能算力储备,其智算集群可支持最大十万卡GPU规模,承载多个万亿参数大模型同时在线训练,为大规模AI集群提供无拥塞通讯的自研RDMA网络架构和低成本高可靠的高性能存储CPFS。阿里云知道怎么设计好用的AI工具。在AI平台层,以机器学习平台PAI为核心的PaaS服务可支持万卡的单任务分布式训练规模,覆盖全链路AI开发工具与大数据服务,AI训练效率提升可达10倍,推理效率提升可达6倍。大模型通往开发者和用户的道路,势必由云计算铺就。阿里云推出了专门的模型API门户——灵积,灵积平台拥有模型上云统一工具链路,能够提供基于云原生的公共部署以及用户自定义独占部署等多种形式,来满足不同模型的需求。平台还积累了模型自适应推理优化和高效微调训练的能力,并提供了基于插件进行模型能力拓展的系统框架。通过灵积,丰富多样化的模型不仅能通过推理API被集成,也能通过训练微调API实现模型定制化。通过开放技术、工具、经验,降低大模型的研发门槛,通过建设活跃的生态社区,激发群体智慧,让更多创新的河流汇入MaaS的时代汪洋之中,促进中国大模型生态的繁荣,共同塑造、呈现一个全新的创造生态。如果这一切变成现实,“大模型创业自由”还会远吗?