Redian新闻
>
GitHub Copilot,是你逼我的

GitHub Copilot,是你逼我的

公众号新闻
出品 | OSC开源社区(ID:oschina2013)
一名开源软件作者决定对 GitHub Copilot 发起诉讼。
Matthew Butterick 是拥有多重身份的程序员,他从 1998 年开始深度参与开源社区,曾在 Red Hat 工作了两年,同时也是作家、设计师和律师,写过两本关于排版的书 ——《Prac­ti­cal Typog­ra­phy》和Typog­ra­phy for Lawyers》,设计了多款字体:Equity,Con­course 和 Trip­li­cate。Matthew 目前是 Racket 的贡献者,自己也写了不少开源软件(托管在自建的仓库),包括用来出版在线书籍的 Pollen ,以及在工作中使用的 AI 软件。
今年 6 月份,Matthew 撰写文章指出 GitHub Copilot 存在法律问题,尤其是对开源 License 的不当处理。近日,对于 GitHub Copilot 的法律问题,Matthew 做出了进一步举动,他重新激活了自己的加州律师执业证,并联合多名其他优秀律师,准备对 GitHub Copilot 发起集体诉讼 —— 理由是它违反了对开源作者和用户的法律责任
GitHub Copilot 自称是 “AI 编程助手”,基于机器学习技术来提供代码建议 / 自动补全。Copilot 的底层技术采用了由 OpenAI 打造的新 AI 系统 Codex—— 经过了数十亿行公开代码的训练。
Matthew 认为,Copilot 基于公开代码的训练生成代码建议均存在法律问题。
  • 训练中存在的法律问题
大多数开源软件采用的 License 都明确描述了授予使用者的权利和义务,比如保留代码的归属信息 (attri­bu­tion)。而且原作者依旧拥有开源软件的版权 (Copyright)。
作为使用者,在面对开源软件时通常有两个选择:
  1. 如果软件代码有明确的 License,遵循开源 License 规定的义务
  2. 如果公开的部分代码没有明确指定开源 License,由于作者拥有软件的版权,使用者可在满足 fair-use 的条件下进行使用
Matthew 指出,GitHub Copilot 肯定无法满足上面的第一条要求,因为如果它在遵守开源 License 的前提下使用公开代码,那么就需要提供大量的 attri­bu­tion 信息,这几乎是每个开源 License 的最低要求。但现实情况是几乎看不到 GitHub Copilot 提供的任何 attri­bu­tion 信息。
因此,GitHub Copilot 对公开代码的使用需要满足 fair-use 条件。虽然 GitHub 的前任 CEO Nat Fried­man 曾表示,GitHub Copilot 基于公开代码进行机器学习训练属于 fair-use。但 Matthew 认为,这是涉及到法律的问题,而不是谁说了就算的。
软件自由保护组织 (Software Freedom Conservancy,SFC) 不同意 Nat Fried­man 的说法,并要求微软提供证据来支持其立场。SFC 负责人曾透露:
我们在 2021 年 6 月私下询问了 Fried­man 和其他微软、GitHub 的代表,要求他们为 GitHub 的公开法律立场提供可靠的法律参考…… 但他们什么都没有提供。
为什么微软不能为他们的立场提供一些法律依据?因为 SFC 是对的:他们根本就没有依据。尽管一些法院已经考虑了相关问题,但目前还没有一个判例直接解决 AI 训练的 fair-use 问题。
  • 使用中存在的法律问题
对于 GitHub Copilot 生成的建议代码,微软表示 “不主张任何权利”。不过微软也没有对生成代码的正确性、安全性或引申出的知识产权问题作出任何保证。一旦使用者接受了 Copilot 的建议,所有这些都将成为自己的问题。
Matthew 举了一个最近的例子。得克萨斯农工大学教授 Tim Davis 在使用 GitHub Copilot 时,得到的建议代码竟然完全和他自己公开的代码一模一样。但这段代码并不是真正的 “开源” 代码,因为它没有采用开源 License。
我们都知道,使用了开源代码就要遵守其 License 规定的义务。但根据 Copilot 的设计,用户根本看不到生成代码的来源、作者,以及 License 等信息,所以他们如何遵守 License?
Matthew 最后谈到了 GitHub Copilot 对开源社区的影响。他认为,也许大多数人不会介意 GitHub Copilot 在没有告知你的情况下就使用你的代码,但如果 Copilot 在抹去开源社区各种痕迹的前提下,随意使用他们的开源代码,你会有什么感想?


延伸阅读
去年 GitHub Copilot 就引发了不小的争议。原因是许多开发者认为,GitHub Copilot 宣称的基于公开代码训练其实是在未遵循开源许可证的情况下,肆意 “抄袭” 开源代码。
个别比较激进的开发者为了抗议 GitHub 未经授权和许可便使用受版权保护的源代码作为 GitHub Copilot 的训练数据,宣布弃用 GitHub。
详情查看:《GitHub 被 "GitHub Copilot" 倒逼成为开源项目?
今年9月,GitHub Next 团队采用调查和实验的方式针对“自称是 “AI 编程助手” 的GitHub Copilot,对开发者的帮助究竟有多大”进行了研究,并表示得到了预期和意料之外的结果。
详情查看:https://www.oschina.net/news/209737/github-copilots-impact-on-developer-productivity
相关链接:https://githubcopilotinvestigation.com/

往期推荐



谷歌推出开源操作系统KataOS,采用Rust和seL4微内核

JetBrains Fleet公测,下一代轻量级全能IDE

到底都有哪些国产的开源操作系统?



这里有最新开源资讯、软件更新、技术干货等内容
点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦~

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
周末愉快 冬瓜"为什么你们当初不逼我?"有远见的父母,舍得让孩子吃这种苦动动嘴就能写代码了!Copilot测试新功能“嘿,GitHub”,告别键盘编码Atop a Lonely Sichuan Mountain, Grit, Hope, and Survival北美求职60秒:GitHub对于数据岗位求职者有什么用?(10月第3周)YY 直播GitHub开源项目,霸屏Github排名榜!硬核观察 #738 Tornado Cash 代码在 GitHub 上重新上传GitHub 上排名 前五 的开源网络监控工具索赔 649 亿!GitHub Copilot 惹上官司,被指控侵犯代码版权, 是开源社区“寄生虫”源码误发布在GitHub上5年之久,丰田近30万用户数据已泄露?已开源~ 开发一个访客管理系统,开源在 GitHub 上了一文掌握所有命令行,包括73个“冷门但有用”的技巧|GitHub 11万标星之作硬核观察 #801 GitHub 年入 10 亿美元硬核观察 #846 GitHub 推出 Copilot 商业版,为代码建议提供辩护和索赔王者荣耀开源环境上榜!九月AI研究GitHub排行来了,「star多」才叫好论文“羊了个羊”背后公司清仓式分红10亿元;Meta元宇宙部门今年已亏94亿美元;微软称GitHub年收入10亿美元|Q资讯大学教授怒喷:“Copilot自动填充了我的代码”,Copilot 发明者回应:相似,但不同!编程神器Copilot逐字抄袭他人代码?GitHub 回应:相似,但不同......喊一声“嘿!GitHub”,说出需求VS Code就能自己写代码了开源程序员愤怒控诉!Github的「AI码农」Copilot就是寄生虫So long, flowers. The London Plane将于平安夜永久关门让程序员动嘴写代码,Copilot测试新功能「嘿,GitHub!」精选SDE岗位 | Cisco、OpenGov、Color Health等公司发布最新岗位!AIGC基于文本生成音乐,现在压力来到配乐行业这边|Github提高警惕!黑客在 GitHub 上利用虚假 PoC 漏洞钓鱼这个羊毛实在!Grubhub 外卖券满$10立减$5!足不出户吃吃吃~Most Beautiful Duets Ever(四)GitHub被起诉微软CEO说漏嘴?收购GitHub四年后首次披露业绩:年收入翻两倍超10亿美元!秋阳杲杲埃及艳后Kleopatra教育随笔(108)高考文言文备考之九硬核观察 #747 GitHub 将关闭趋势页面,中文项目再不能霸榜硬核观察 #812 GitHub Copilot 被诉“规模空前的软件盗版”GitHub疯传!求职亚麻的留学生,请立即停止刷LeetCode!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。