Redian新闻
>
Huggingface榜首开源模型惹争议:魔改Apache协议,达到一定门槛要收钱

Huggingface榜首开源模型惹争议:魔改Apache协议,达到一定门槛要收钱

公众号新闻

机器之心报道

机器之心编辑部

开源又没完全开源。


我们知道,Huggingface 是 AI 领域著名的开源平台,任何人和机构都可以在该平台上发布自己以及使用他人的模型、数据集,为业内提供了研究便利。因此它深受 AI 圈的喜爱,其最受欢迎的 Transformer 库已在 GitHub 上收获 102k 的 Star 量。

不过近日,由 TII 开发并发布在 Huggingface 上的一个大模型引发了广泛争议。该大模型是 400 亿参数的因果解码器模型 Falcon-40B,它在 RefinedWeb 的 1000B token 上进行训练,并使用精选数据集增强。它在 Huggingface 的 OpenLLM 排行榜上排首位,其性能优于 LLaMA、MPT、RedPajama 和 StableLM 等。


排行榜地址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

虽然 Falcon-40B 模型本身很强大,但其遵循的开源协议却在开源圈引起了轩然大波。它在一个允许商业使用的许可证下可用,即如下 TII Falcon LLM License。


开源协议:https://huggingface.co/tiiuae/falcon-40b/blob/main/LICENSE.txt

该许可证部分基于 Apache License Version 2.0。Apache License 2.0 协议来自著名的 Apache 基金会,它对商业应用友好。使用者可以在需要的时候修改代码来满足需要并作为开源或商业产品发布 / 销售。

但有人发现了 TII Falcon LLM License 的一些「猫腻」。推特用户 @natfriedman 总结了它与 Apache License 2.0 开源许可的相似与不同之处。其中相似之处在于都授予使用、修改和分发许可作品的广泛许可,要求在分发中包含许可文本和归属,并具有责任限制、担保豁免权。

不过区别在于,TII Falcon LLM License 要求一旦达到收入门槛,需支付商业用途特许权使用费,而大多数开源许可不需要。TII Falcon LLM License 对如何发布或分发作品也有额外限制, 比如要求归属于「Falcon LLM technology from the Technology Innovation Institute」。

同时,TII Falcon LLM License 不允许在其他不同的许可下重新授权作品,而大多数开源许可允许衍生作品根据不同的协议获得许可。TII Falcon LLM License 还明确地排除了 Falcon LLM 的某些版本 / 大小的许可,而开源许可通常适用于所有版本。

最后,TII Falcon LLM License 对修改源代码和目标代码都有额外的要求,除非分发编译的模型。总之,该许可允许开放使用和修改,但同时又保留了很多自有权利。


@natfriedman 的观点得到了很多人的附和,另一位推特用户 @_msw_直截了当地指出,将专有许可基于受信任的 Apache License 2.0 之上并称其为「开源」(实际上不是真正的开源),这种利用 Apache 软件基金会来之不易的信誉和品牌的做法是不对的


又有人问了,这意味着 Falcon-40B 不开源或不是免费软件?@_msw_回复称它既不开源也不是免费软件。


吃瓜群众有的同意并认为 TII Falcon LLM License 根本不是开源许可,但也有的指出 TII Falcon LLM License 本就是「部分」基于开源协议。



业内从事开源人士发表了观点,认为魔改 Apache 或其他主流开源许可证不叫开源,甚至算不上开放内核。


Falcon-40B 是否开源但又不完全开源呢?机器之心的读者们,你们怎么看?

参考链接:https://huggingface.co/tiiuae/falcon-40b



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Hugging Face:在人工智能的大航海时代悄悄地造一艘方舟|全球独角兽JARVIS项目原作解读:连接ChatGPT和HuggingFace解决AI问题亲妈帮带娃要不要收钱?美女网友吐槽对方要收$20/小时!彻底反转:号称「碾压」LLaMA的Falcon实测得分仅49.08,HuggingFace决定重写排行榜代码ChatGPT自己会选模型了!微软亚研院+浙大爆火新论文,HuggingGPT项目已开源炫到爆炸!HuggingGPT在线演示惊艳亮相,网友亲测图像生成绝了硬核观察 #993 Hugging Face 发布免费的代码生成 AI不对齐,反而性能爆表?130亿模型碾压650亿,Hugging Face大模型排行榜发布让ChatGPT调用10万+开源AI模型!HuggingFace新功能爆火:大模型可随取随用多模态AI工具ChatGPT上下文碾压64K开源模型!UC伯克利:开源模型能力严重「虚标」|最新硬核评测曝光ChatGPT自己会选模型了!浙大和微软提出:HuggingGPTHuggingChat叫板ChatGPT!300亿参数大模型免费用,网友:真香碾压LLaMA的最强开源大模型居然来自阿联酋,OpenAI和HuggingFace 为它吵了起来微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4 训练,实力碾压当前最强开源模型HuggingChat:第一个面向所有人使用的 ChatGPT 开源替代方案 | Linux 中国ChatGPT的替代品来了!HuggingChat号称媲美GPT-3.5,要拆掉OpenAI的围墙对标ChatGPT,Hugging Face推出开源聊天机器人HuggingChat对标ChatGPT!Hugging Face推出开源聊天机器人HuggingChat用ChatGPT「指挥」数百个模型,HuggingGPT让专业模型干专业事Agustín Hernández:中美洲建筑背景下的未来主义巨构对Hugging Face开源模型精准投毒!LLM切脑后变身PoisonGPT,用虚假事实洗脑60亿人绿野仙踪,迷失在世外桃源比HuggingFace快24倍!伯克利神级LLM推理系统开源,碾压SOTA,让GPU砍半《美丽的牧羊姑娘》&《卧龙吟》老海归丧偶后复旦MOSS大模型开源了!Github和Hugging Face同时上线5037 血壮山河之武汉会战 鏖战幕府山 6支持80+编程语言、集成VSCode,HuggingFace代码大模型来了给爆火的Llama 2划重点,Huggingface机器学习科学家写了篇分析文章亲妈帮带娃要不要收钱?美国网友吐槽对方要收$20/小时!春季这些火爆UGG必穿! UGG毛绒拖鞋低至6折!0门槛克隆ChatGPT方案再升级,开源模型完整复现,在线体验无需注册碾压LLaMA,「猎鹰」彻底开源!400亿参数,万亿token训练,霸榜Hugging Face支持80+编程语言!集成VSCode,HuggingFace代码大模型来了中美航线的前景---我的一己之见
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。