出品 | OSC开源社区(ID:oschina2013)《The Register》发布了探讨更新开源许可证的文章。作者的观点正如文章标题所言:开源许可证需要摆脱 20 世纪 80 年代的束缚,并不断发展以应对人工智能。他指出,自由软件和开源许可证在 20 世纪 70 年代和 80 年代的主要作用对象逐步演变成 “代码”。但今天,它必须再次转型以处理人工智能模型。虽然人工智能诞生于开源软件,但基于版权法处理软件代码的自由软件和开源许可证 —— 并不适合用于人工智能开源软件的大语言模型 (LLM) 神经网络和数据集。由于许多 LLM 的编程数据集采用了大量自由软件和开源代码,因此必须针对这种情况采取措施。2022 年 11 月,一项集体诉讼针对微软、GitHub 和 OpenAI 提起,由 Matthew Butterick 和 Joseph Saveri 律师事务所提交的诉讼声称,Copilot 训练使用的开源代码侵犯了代码所有者的权利。该诉讼指控微软及其子公司 GitHub 和其商业伙伴 OpenAI 创建了一种名为 GitHub Copilot 的人工智能编码助手,它依赖于 “前所未有规模的软件盗版”。Copilot 于 2021 年 6 月由 GitHub 推出,它采用从网络上抓取的公共代码库进行训练,其中许多都带有要求任何人重用代码时都必须保留代码的归属信息 (attribution),而且原作者依旧拥有开源软件的版权 (Copyright)。Copilot 被发现在不遵守条款的情况下使用了开源代码 —— 因此促使了这起诉讼的发生,指控这些公司在大规模违反版权法。这就是为什么 OSI 执行董事 Stefano Maffulli 和许多其他开源和人工智能领域的领导者携手合作,致力于以对双方都有意义的方式将人工智能和开源许可证结合起来。正如文章中所提到的,不要认为这种诉讼只是微软这种大公司才面临的问题。Sean O'Brien(耶鲁法学院网络安全讲师兼耶鲁隐私实验室创始人)指出:“我相信很快会出现一个与专利流氓类似的子行业,但这次围绕着人工智能生成作品。这些流氓会追踪 “你” 的 ChatGPT 和 Copilot 代码。”德国研究员兼政治家 Felix Reda 声称所有人工智能生成的代码都属于公共领域。美国律师 Richard Santalesa(SmartEdgeLaw Group 创始成员之一)则观察到存在合同和版权法问题,认为它们并不相同。Santalesa 认为生产人工智能生成代码的公司将 “与他们所有其他知识产权一样,将其提供的材料(包括人工智能生成的代码)视为其财产”。这个问题目前仍然在讨论之中,相信未来会有更多的法律和指导方针来解决这个问题。📍地点:广东省深圳市南山区高新南四道创维半导体设计大厦裙楼四楼·SKYWORK会议中心【国际会议中心】
【嘉宾预告】
演讲人:
常亮,CubeFS开源分布式文件存储项目maintainer
演讲主题:
AI背景下CubeFS开源分布式文件存储平台的演进与发展
演讲大纲:
AI大模型取得令人惊叹的表现,正在成为最热门的谈论话题,AI 的大模型构建在算力和存储之上,AI 本身的数据特性和存取特性明显,海量的 AI 语料存储,小文件等存取需求,对存储系统一直是一种挑战。为了适配更强大的算力和语料,传统的中心存储,渐渐不能满足 AI 的算力需求,从而云上云下结合是必经之路,CubeFS提供了一整套针对 AI 大模型计算的存储调度服务,元数据缓存和数据缓存,以提高计算效率,极大改善混合云场景的延迟问题。