开源大模型将“杀死”闭源模型?
Hugging Face创始人Clem Delangue曾预言,“OpenAI不足为惧,开源会慢慢赶上来”。
7月19日,LLaMA 2宣布开源,所有人可直接商用。近三个月过后,我们才逐渐意识到——这一天,也许是大模型发展的分水岭。
在此之前,全世界的开源大模型不计其数,但主要停留在开发研究层面,LLaMA 2的开源犹如一颗重磅炸弹,引爆了整个大模型圈——有人哭晕在厕所,有人梦里也能笑醒。
自LLaMA 2开源以来,首先掀起一波以其核心的开源,如LLaMA 2低成本训练版、LLaMA 2最强版、微调版等。截至发稿,Hugging Face上的LLaMA 2相关模型已经有5000多条结果,Github上也有1500多个词条。
全球创业者通过解构、增强LLaMA 2构建了行业专有模型,进而出现了一波LLaMA 2+法律、LLaMA 2+医疗等系列开源行业模型,仅国内便有十几个开源行业模型。
此外,国内头部科技公司的开源模型也在不断攻城略地:阿里巴巴的QWEN-7B开源一个多月下载量破100万;百川智能开源的Baichuan-7B、13B开源模型下载量突破500万,有200多家企业申请部署开源大模型。
反观闭源大模型调用API的模式,数据需要上传,存在隐私安全隐患,且按照调用次数收费,而开源模型本地部署完全免费,商用后产生的利润也可以收归己有。在这种情况下,仅仅是基于成本考量,便已经有许多企业放弃上千万元费用,转而部署和微调LLaMA 2。
❏ 01
开源大模型,开的是什么?
目前,科技公司在大模型的开源和闭源上有以下几种路径:
首先是完全闭源的大模型,例如OpenAI的GPT-3.5、GPT-4,以及国内百度的文心一言;
其二是先闭源再开源,例如阿里巴巴的通义千问、智谱AI的GLM系列模型;
其三是先开源再闭源,例如百川智能的Baichuan。
目前国内能够主动开源大模型并提供商业许可的企业比较有限,主要有以开源切入AI赛道的百川智能、AI科技大厂阿里、大模型初创公司智谱AI,以及走精调LLaMA 2路线的虎博科技。
这也是大模型浪潮下比较典型的入局路线,一类是自研大模型开源路线,一类是走LLaMA 2路线。前者在国际上的典型代表是Stability AI,该公司先后开源了一系列文生图模型,凭一己之力撑起了开源文生图领域;后者的代表有中东土豪研究院,在LLaMA 2基础上做大参数,仅在LLaMA 2开源50天后便推出了地表最强开源模型Falcon 180B,霸榜Hugging Face。
在LLaMA 2开源之后,Meta先后推出了帮助开发人员自动生成代码的开源模型Code LLaMa,全新AI翻译模型SeamlessM4T、允许开源视觉模型DINOv2商业化,并推出视觉评估模型FACET。
不难发现,Meta的开源策略是在各个AI领域发布最先进的开源模型,吸引更多开发者的关注和使用,壮大整个AI开源生态并反哺业务、巩固地位——这与当年英伟达推动GPU计算的开源策略如出一辙。
❏ 02
开源和闭源,矛盾吗?
根据此前报道,Meta已经将新一代开源大模型提上日程,能力对标GPT-4。国外大模型格局看似是OpenAI“一超多强”,实际上众多科技公司环伺,已然形成开源对闭源的围剿之势。
开源大模型为企业提供了闭源的替代方案,在非常大的数据集上进行训练,拥有几十亿参数的大模型就可以与超大规模大模型相媲美,且只需极少的预算、适量的数据以及低阶适应等技术就可以获得满意的效果,训练成本降低了上千倍。并且开源大模型的发展速度远快于封闭生态系统——就像安卓系统上有着诸多新功能。
但开源和闭源并非目的,而是手段。
正如以开源切入大模型赛道的百川智能,在Baichuan-7B、13B后拿出了Baichuan-53B闭源大模型。王小川的解释是:模型变大之后没有走开源的方式,是因为大家部署起来成本会非常高,所以使用闭源模式让大家在网上调用API。
在当前,闭源大模型的价值集中体现在通过调用API来降低高性能大模型的训练、推理和部署。这也是OpenAI闭源的思路,其自身技术的绝对领先优势使得闭源的价值也非常大。
腾讯云数据库负责人王义成认为,开源的本质化也是商业化,是从宏观层面考量能否满足公司的长期商业利益。开源的本质是扩大生态和影响力,前提是我们要清楚自己的定位、目标客户群,考虑开源能否帮助产品突破。
开源和闭源并不是完全对立的关系,只是在技术发展初期的路径选择不同。就像安卓可以尝鲜更多功能,iOS则更加安全和省心一样,开源和闭源在功能上相互补充,各有优势和劣势。
在未来,一定不是one size fits all,不同的场景适配的AI模型一定是不同参数、不同形式的。
开源和闭源,只是位置和阶段的不同。二者一定会是相互竞争、相互补充的,但在二者开战的这个AI新赛段里,一定会为我们带来更多的惊喜和思考。
我们拭目以待。
设置星标不迷路哟~
美国硅谷企业游学/美国硅谷企业考察
美国硅谷AGI市场考察/OpenAI企业游学
考察团名额有限,正在火热招募中
也可扫描文末二维码
可根据行业免费定制行程哟!
*图片均来自于网络,如有侵权请联系删除
微信扫码关注该文公众号作者