五年磨一剑:阿里达摩院重磅推出AI模型社区「魔搭」,300+模型全面开源
新智元报道
新智元报道
【新智元导读】刚刚,阿里达摩院重磅推出 AI 模型社区「魔搭」。首批开源模型超过 300 个,包括 150 多个 SOTA 模型和 10 多个大模型,其中超过 1/3 为中文模型。共覆盖视觉、语音、自然语言处理、多模态等超过 60 个主流任务。
2012 年,深度学习掀起第三次 AI 浪潮,随后 2016 年,AlphaGo 第一次战胜人类围棋选手,持续引爆 AI 发展浪潮,吸引众多开发者投身其中。
然而开发者很快发现, AI 从研发到落地部署门槛较高,需投入巨额成本,不仅要有大量数据来训练模型、优化算法,还要复杂的安装和部署。如何降低研发和应用的门槛,实现 AI 普惠?如何面向各行各业不同的应用场景,便于开发者快速定制 AI 解决方案?
对此,作为业内顶尖的 AI 研究机构,阿里达摩院在成立五年之际做出重大举动。
11 月 3 日,达摩院联手中国计算机学会(CCF)开源发展委员会重磅推出AI 模型社区魔搭 ModelScope,首批合作方还包括澜舟科技、智谱AI、深势科技、中国科学技术大学等多家科研机构,旨在打造下一代开源的模型即服务共享平台,致力降低 AI 应用门槛。
CSDN 创始人&董事长,极客帮创投创始合伙人蒋涛与阿里巴巴集团资深副总裁、阿里达摩院副院长周靖人,从魔搭社区的发展历程出发,共同探讨如何让 AI 更好地服务广大开发者,推进中国 AI 行业的发展。
破解 AI 应用难题,「让天下没有难用的AI 模型」
关注本土化需求,推动中国智能化发展
蒋涛:我们观察到魔搭似乎与国外 Huggingface 平台的发展路径相近,均是将模型开源,为开发者提供开放开源平台。与之相比,魔搭有哪些不同之处?
周靖人:Huggingface 从明星项目 Transformer 库入手,随后构建平台让用户可以托管相关的机器学习模型和数据集,还可共享、协作与投入生产应用,目前在国外生态蓬勃发展。
在国内,魔搭社区适逢其时,填补 AI 模型应用服务的空白,建设 AI 开发者生态。达摩院作为启动者,将这五年来所积累的最优模型毫无保留地开放开源给大家,目的为了推进中国 AI 模型社区的发展。从模型类型来看,不光有Transformer,还有Diffusion等多种架构的模型。更重要的是,魔搭更关注本土需求,提供大量中文模型,第一批提供的中文 AI 模型已超过 100 个,覆盖自然语言处理、语音等常用任务,还提供上述提到的阿里通义大模型系列、澜舟科技的孟子系列模型等优质中文大模型。
社区希望帮助中国开发者降低 AI 模型使用难度,降低模型的使用门槛。将传统软件开发者升级为 AI 开发者,让他们把 AI 模型集成到实际开发应用中。在智能化时代,每个开发者都将成为 AI 开发者,未来期待和中国开发者共建模型生态。
蒋涛:聊到帮助开发者降低 AI 使用门槛,能否聊聊魔搭所提供的能力与 AutoML 有哪些差异?
周靖人:这两者从不同的角度降低 AI 使用门槛。AutoML 包括自动选择模型、特征集合、模型超参数,自动搜索和裁剪模型结构等等。但是开发者仍然需要准备丰富的训练数据,初始的模型集合,也需要充足的算力来支持。
魔搭一方面提供训练好的模型,方便开发者快速集成到他的业务开发中去。另一方面,伴随大模型的发展,越来越多的的工作可由大模型来实现,如将一个论坛里所有的文章重新学习,进行分类等,大量的基础工作可通过语言模型或者通过多模态的预训练模型完成,而后再针对网站文章进行调优,这样无需耗费大量机器成本,无需耗费大量的时间。
蒋涛:我们可以理解为,魔搭在深度学习和传统的机器学习上,提供更广泛的能力。
周靖人:是的。如今预训练大模型成本较高,属于技术含量较高的领域。以达摩院为例,预训练大模型可能需要上百张甚至上千张 GPU 卡,并耗费几个星期到一个月才能训练完一个大模型。
魔搭社区将这些大模型开源给大家下载,还可以进行二次训练。其实达摩院在研发这些大模型时,并不确定大模型的具体应用,没有提前预知到下游任务。大模型帮助开发者提取、抽象知识,通过下游调优,将下游目标精确化,从而快速形成针对行业的解决模型,解决实际应用问题。
蒋涛:使用魔搭社区来调优后,与开发者沿用传统的AI开发方式,是否有巨大的效率提升?
周靖人:具体案例要具体分析,有的案例是超过 1:9,即节省了 90% 的工作,当然也有 3:7。魔搭社区目前处于起步阶段,后续持续完善,希望开发者多多反馈,沟通交流,共同建设魔搭社区,长期以往,相信未来会提高上述比例,通过社区来解决更多 AI 模型开发难题,提升研发效率。
魔搭的下一步
蒋涛:开发者使用 AI 模型离不开云,魔搭社区与阿里云建立了哪些连接?
周靖人:AI 模型涉及大量的数据、算力,线下很难找到适合的机器来跑,AI 模型的开发和使用,越来越跟云资源紧紧联系起来。魔搭社区无缝对接阿里云两个重量级产品——机器学习平台 PAI 和弹性计算 ECS,为开发者提供一定的免费资源,助力大家尝试 AI 模型的开发。
大家登录到社区后,可关联阿里云账号后,在网站点击相应的按钮就能跳转到阿里的开发环境里,并集成了系列 SDK ,方便开发者快速下载和开发。
但要说明的是,魔搭社区的模型支持多样化的训练和部署方式,用户可自主选择,社区坚持开源开放、兼容并包,不做任何绑定。
蒋涛:当社区在国内建设有一些成果后,有可能会考虑发展海外社区建设吗?
周靖人:目前是面向中国开发者,致力弥补国家智能化生态建设的空白。随着中国人工智能技术产业的发展,未来魔搭平台也会走向海外,将 AI 模型能力普惠全球开发者。
点击阅读原文,立即体验魔搭社区 modelscope.cn
微信扫码关注该文公众号作者