号称史上最强、击败LLaMA的大模型开源了,却因为许可证被骂
出品 | OSC开源社区(ID:oschina2013)
TII(阿联酋阿布扎比技术创新研究所)近日推出了号称是 “史上最强的开源大语言模型”——Falcon(猎鹰)。虽然 Falcon 的参数比 LLaMA 小,但性能却更加强大。
据介绍,Falcon-40B 是 400 亿参数的因果解码器模型,它在 RefinedWeb 的 1000B token 上进行训练,并使用精选数据集增强。它在 Huggingface 的 OpenLLM 排行榜上排首位,其性能优于 LLaMA、MPT、RedPajama 和 StableLM 等。
Falcon 作为开源大模型,已公开源代码和模型权重,可供研究和商业使用 —— 但其采用的许可证却引起了广泛争议。
Falcon 采用了自拟的 TII Falcon LLM License —— 在 Apache License 的基础上进行了一系列修改。Apache License 是非常流行的开源许可证,对商业使用友好。使用者修改代码只需满足相关需求即可将新作品作为开源或商业产品发布 / 销售。
TII Falcon LLM License 和 Apache License 的相似之处是,授予使用、修改和分发许可作品的广泛许可,要求在分发中包含许可文本和归属,并具有责任限制、担保豁免权。
不过 TII Falcon LLM License 要求它的用例需支付商业用途特许权使用费 —— 收入超过 100 万美元的任何商业应用都要收 10% 的授权费。
此外,TII Falcon LLM License 对如何发布或分发作品也有额外限制, 比如要求归属于「Falcon LLM technology from the Technology Innovation Institute」。
对于 TII 的做法,有人认为,Falcon 的许可证基于 Apache License 进行了魔改,不属于真正的开源。也有人表示,TII 打着 Apache 的旗号将 Falcon 包装成开源,但却有诸多限制,这种做法损害了 Apache 软件基金会来之不易的信誉和品牌。
事实上,Falcon 的做法和 Unreal 虚幻引擎类似。虚幻引擎的 License 分为两种:发行许可和创作许可,创作许可不能用于游戏制作。至于发行许可,如果基于虚幻引擎开发的游戏总收益高于 100 万美元,则将会被收取游戏总收益的 5%,低于 100 万美元都是免费使用。
问题来了,你认可 Falcon 的做法吗?
往期推荐
点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦
微信扫码关注该文公众号作者