Redian新闻
>
ChatGPT被起诉索赔30亿!「未经允许收集并泄露个人信息」,16人匿名状告OpenAI

ChatGPT被起诉索赔30亿!「未经允许收集并泄露个人信息」,16人匿名状告OpenAI

公众号新闻
明敏 发自 凹非寺
量子位 | 公众号 QbitAI

一天吃两起官司,ChatGPT现在有大麻烦了。

原因都和数据有关。

先是16人匿名起诉OpenAI及微软,认为他们在未经允许的情况下使用并泄露了个人隐私数据,索赔金额高达30亿美元

紧接着,2位全职作者提出,OpenAI未经允许使用了他们的小说训练ChatGPT,构成侵权

而且两边的原告都表示,OpenAI从互联网上搜刮的数据可太多了,除了他们以外还有非常多人的数据正在被违规使用。

网上的讨论很多,有人表示作家就是应该维权,并且获得适当的报酬。

但也有人认为,生成式AI学习互联网数据就像是学生去参观艺术作品一样,应该选择开放。

现在这两起诉讼都被递交到了加利福尼亚旧金山联邦法院。

被告方OpenAI暂时没有做出公开回应。

16人索赔30亿

先来看第一起诉讼。

6月28日,16位匿名人士向OpenAI及微软发起诉讼,他们认为基于ChatGPT的AI产品在没有告知或获得本人同意的情况下,收集且泄露了他们的个人信息。

这种行为违反了AI模型数据相关的法律政策,而且没有付费。

他们从互联网、书籍、文章、网站和帖子中抓取了3000亿个单词,其中包括未经允许获取的个人信息。

这其中包含账户信息、姓名、联系方式、电子邮件、支付信息、交易记录、浏览器数据、社交媒体信息、聊天数据、cookie等等。

这使得个人信息被嵌入到了他们的AI产品中,而这些信息可以反映出个人爱好、观点、工作履历甚至家庭照片等。

原告认为OpenAI没能充分将这些敏感信息进行过滤,会导致数百万人面临信息被泄露的风险。

而且他们指控如上抓取数据的行为,OpenAI是“秘密进行”的,没有按照适用法律要求的那样注册为数据代理商。

负责这次起诉的律师事务所Clarkson,此前曾负责过数据泄露和虚假广告等问题的大规模集体诉讼。

但能否胜诉目前还很不确定。

知识产权律师凯瑟琳·加德纳(Katherine Gardner)表示,当用户将内容上传到社交平台或者其他网站时,他们都会授予平台广泛许可,允许平台使用他们的内容。

因此,普通用户想要就AI模型的数据获取问题获得赔偿,具有比较高的挑战性

以及有人发现在这份长达157页的诉讼书中,大量引用了媒体及学界在AI伦理道德方面的讨论和警告,但是对于造成实际影响的具体案例列举不多。

另一边,两位美国作家也在同一天起诉OpenAI,认为他们的作品被拿去训练ChatGPT。

具体的证据是,ChatGPT能为他们的书生成“非常准确”的摘要,这足以说明这些书被收录在数据库中。

保罗·特朗布莱(Paul Tremblay)和莫娜·阿瓦德(Mona Awad)表示,ChatGPT未经许可就从数千本书中拷贝数据,这侵犯了作者们的版权。

起诉书中预估,OpenAI的训练数据中至少包含30万本书,其中很多来自侵权网站

比如OpenAI在披露GPT-3训练数据情况时,就表示其中包含两个互联网图书语料库,大概占比为15%。起诉作者认为这些数据就是来自影子图书馆网站的,比如Library Genesis、Sci-Hub等。

以及在2018年,OpenAI透露他们给GPT-1喂的数据中包含7000+本小说。起诉方认为这些书是研究人员从一些盗版网站上复制下来的,而没有获得作者的同意或授权。

目前OpenAI方面没有进行公开回应。

实际上,从生成式AI大火以来,AI公司吃版权、数据隐私官司,也真的不稀奇了。

OpenAI一直深陷数据风波

早在去年11月时,OpenAI和GitHub一起推出的代码助手Copilot,就被程序员们告上了法庭。

原告们认为Copilot侵犯了众多原创代码作者的版权,同时还泄露了用户隐私,因此向法院提起诉讼,索赔达90亿美元

但到目前为止,这个案件还没有最终定论。

AI画画那边,Stability AI、Midjourney等也同样官司缠身。

因为发现只要输入自己的名字,就能生成个人风格的画作,画家凯利·麦柯南(Kelly McKernan)联合另外两位创作者一起提起诉讼。

律师团队和上面起诉Copilot的都是同一家。

以及网站平台方也不愿意被白嫖数据。

这不最近马斯克给推特限流,给出的理由就是“不想让AI白嫖数据了”。目前限制措施还在实行中,还不知道之后会有怎么样的变化。

Reddit则表示自家平台上的数据非常有价值,所以推出了付费API,价格并不低,这个操作导致不少第三方应用被迫关闭。

总之,AI在网络上大规模抓取数据训练后,带来的隐私安全问题、版权问题层出不穷,被牵扯进来的人也越来越多。

但目前版权问题该怎么算,业内还没有形成确定的规范。

只有日本方面传出过消息,不会对训练AI所使用的数据实施版权保护,因为这能加速AI发展。

参考链接:
[1]
https://www.theregister.com/2023/06/28/microsoft_openai_sued_privacy/
[2]https://www.reuters.com/legal/lawsuit-says-openai-violated-us-authors-copyrights-train-ai-chatbot-2023-06-29/
[3]https://www.washingtonpost.com/technology/2023/06/28/openai-chatgpt-lawsuit-class-action/

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【最新】针对强制索取、超范围收集个人信息等八类问题,沪启动“亮剑浦江·消费领域个人信息权益保护专项执法行动”纽约地铁泄露个人信息?!MTA紧急关闭了这项功能OpenAI发布给ChatGPT定制人格角色的新功能;苹果已悄悄开发Apple GPT|AIGC周观察第十一期OpenAI遭起诉:训练ChatGPT,涉嫌窃取数百万用户信息脑阔疼!竞选广告未经允许就放家门口?竞选后不移除屋主还要被罚款!ChatGPT 又断网了!OpenAI 暂时下线 ChatGPT 搜索功能,只因绕过付费墙?最新案例 | 停车场缴费违法违规收集个人信息被处罚外派故事 (30)约翰和女出租车司机 (下)【财闻联播】高考刷屏!迟到37分钟仍进考场,官方回应!未经允许,此地禁止街拍繁复不是一种美丽刚刚,OpenAI官方ChatGPT速成课流出!留学生:一周驯化GPT的方法找到了....“扫码点餐”违规收集个人信息,网友开了场“吐槽大会”明星批量起诉自媒体侵权,2张图索赔3.5万元,创作者应该怎么办?ChatGPT被「神秘代码」攻破安全限制!毁灭人类步骤脱口而出,羊驼和Claude无一幸免《行香子 - 贺吉安一中百年华诞》赔偿30亿?OpenAI因版权被多方状告,作家集体起诉,抗议ChatGPT训练侵权2023回国 梦牵魂萦的上海南京路,外滩(多图)智能周报|OpenAI发布ChatGPT企业版,预计今年营收10亿美元;首批11家国产大模型「获批」,不包括阿里巴巴通义大模型OpenAI官方ChatGPT速成课流出!一周驯化GPT的方法找到了....微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4 训练,实力碾压当前最强开源模型OpenAI突发更新!GPT-3.5正式开放「微调」,人人可打造专属ChatGPT|附最全官方指南“枪!他有枪!”十个门枪案嫌疑人被逮捕!有人匿名向警方举报了他!巴黎市长将重修Châtelet 广场以方便行人学生坠河身亡,班主任被起诉索赔1元!终于找到ChatGPT智商下降的原因了!OpenAI侧面回应,GPT可能真被你们玩坏了?《夏日的玫瑰》&合唱《天下有情人》【城事】巴黎市长将重修Châtelet 广场以方便行人App违规收集个人信息,闪送等企业被要求限期整改扎克伯格发布更强「免费版 ChatGPT」!用 open 的 AI 挑战 OpenAI终于找到 ChatGPT “智商”下降的原因了!OpenAI 侧面回应,GPT 可能真被你们玩坏了?​​李嘉诚将投资千亿在欧洲建5G网络;王小川发布开源中英文大模型;​钟薛高回应21家分公司全部注销;故宫禁止未经允许进行商业拍摄OpenAI官方ChatGPT速成课流出!留学生:一周驯化GPT的方法找到了....超10万名ChatGPT用户信息被泄露;苹果机器学习关键人物离职;OpenAI考虑打造AI模型应用商店丨AIGC大事日报GPT-4竟然有身体,167cm!清华、北师大重磅研究:ChatGPT能像人一样感知行动OpenAI官方ChatGPT速成课流出!留学生一周驯化GPT
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。