新闻第54期 | ChatGPT引发的人工智能生成作品归属思考
作者 | 黄铄媛 香港大学LL.M.
任彦锦 中央财经大学硕士
汤昊男 中国政法大学硕士
曹炜嘉 圣路易斯华盛顿大学J.S.D.
审稿 | 胡婧卓 UCLA LL.M.
Ellen Chen Cornell LL.M.
编辑 | 邵娅绮 浙江工商大学本科
责编 | 戚琳颖 大连海事大学本科
ChatGPT引发的人工智能生成作品归属思考
摘要
ChatGPT爆火全网的同时,也引发了人们对于人工智能作品著作权归属的探讨。本文深入分析ChatGPT内容生成模式,发现ChatGPT的产生离不开大规模自然语言数据集,ChatGPT可以通过与用户的对话来获得用户的反馈,从而不断改进生成内容,进而产生具有“独创性”的作品。目前,我国《著作权法》第11条没有将AI作为著作权的所有者进行规定。因此,笔者认为应当根据AI及用户贡献“独创性”的程度,来确定AI生成作品应当属于AI创作团队还是属于用户。
一、ChatGPT的内容生成模式
ChatGPT(Chat Generative Pre-training Transformer,生成型预训练变换模型)是一款由OpenAI开发的大型语言模型(Large Language Model),该模型是可以阅读、总结和翻译文本的人工智能(Artificial Intelligence,AI)工具。ChatGPT可以用多种语言与用户进行交互,回答用户提出的各种问题,提供相关的信息、建议和解决方案。
ChatGPT的内容生成模型基于深度学习技术和自然语言处理算法。它使用一种名为Transformer的模型架构,该模型架构通过处理大量的自然语言数据,生成逻辑严密、语言流畅性和语法正确的自然语言文本。
为了生成更加“智能”的回答,ChatGPT会对用户提出的问题进行语义理解和上下文分析,以便更好地明确用户的意图和需求。理解问题后,它会使用机器学习技术和自然语言处理算法来推断并生成回答。
图一 图中内容由ChatGPT“创作”,来源openai.com
OpenAI开发团队使用人类反馈强化学习方法(Reinforcement Learning from Human Feedback,RLHF)来训练ChatGPT。该团队在开发的ChatGPT前代产品InstructGPT时同样使用了RLHF,但二者在数据收集设置上略有不同。
第一,初始模型的训练方法为“监督微调(Supervised Fine-tuning)”。首先由真人提供对话,两位训练者需要在对话中分别扮演用户和人工智能助手。开发团队给训练者提供模型编写的建议,以帮助他们编辑恰当的回答。开发者再将这个新的对话数据集与InstructGPT的数据集混合,并将其转化为对话格式。
第二,比较数据的收集。为了创建一个用于强化学习的奖励模型,开发者需要收集比较数据,如两个以上按质量排名的模型化回答。为了收集这些数据,开发者采用了真人参训者与聊天机器人的对话的方式。随机选择了一个模型编写的信息,抽查了几个备选答案的完成情况,并让真人训练者对其进行排名。利用奖励模型,开发者可以使用近似策略优化(Proximal Policy Optimization)对模型进行微调,并对这个过程进行多次迭代。ChatGPT的模型在2022年初完成训练,它是由GPT-3.5系列中的一个模型微调而成。
图二 ChatGPT的内容生成模式,来源:openai.com
二、ChatGPT生成内容是否构成作品
使用ChatGPT生成的诗、论文、文案等内容是否构成我国《著作权法》规定中的“作品”?在学界讨论和司法实践中,ChatGPT等人工智能输出的内容是否受著作权保护,主要争议点在于其能否满足“作品”的构成要件以及是否符合我国《著作权法》的立法宗旨。
根据我国《著作权法》第3条的规定,受著作权保护的“作品”应当符合以下要件:
(1)具有独创性;
(2)必须属于文学、艺术和科学领域内的创作;
(3)能以一定的形式表现;
(4)属于智力成果。
因(2)(3)要件属于形式要件,本部分重点关注司法实践对(1)(4)要件的认定规则。
ChatGPT生成内容是否具有独创性?在深圳市腾讯计算机系统有限公司诉上海盈某科技有限公司侵害著作权及不正当竞争纠纷一案中,深圳南山区人民法院明确表示,人工智能软件生成的作品,只要其外在表现符合文字作品的形式要求,其表现的内容体现出对信息的选择、分析、判断,作品结构合理、表达逻辑清晰,具有一定的独创性,就可以认定生成内容具有可版权性,盗用内容可能侵犯信息网络传播权。因此,ChatGPT生成的内容,也并非所有均可视为作品;例如针对事实内容的陈述,如果不具有独创性和“思考痕迹”,就难以从形式要件上认定其为作品。
ChatGPT生成内容是否构成智力成果?北京互联网法院在北京菲林律师事务所诉百度网讯科技有限公司侵害署名权、保护作品完整权、信息网络传播权纠纷一案判决中表明,从案涉分析报告的生成过程看,选定相应关键词,使用“可视化”功能自动生成的分析报告,具有一定的独创性,但是根据现行法律规定,文字作品应由自然人创作完成。虽然随着科学技术的发展,计算机软件智能生成的此类“作品”在内容、形态,甚至表达方式上日趋接近自然人,但根据现实的科技及产业发展水平,现行法律权利保护体系已经可以对此类软件的智力、经济投入给予充分保护,就不宜再对民法主体的基本规范予以突破。因此法院认定,自然人创作完成仍应是著作权法领域文字作品的必要条件将ChatGPT生成内容认定为“作品”是否违背《著作权法》立法宗旨?王迁教则在《论人工智能生成的内容在著作权法中的定性》一文中表示,“著作权法的立法目的是鼓励作品的创作,因此,作品是作为有血有肉的自然人对于思想观念的表达,由非人类‘创作’的东西不属于著作权法意义上的作品。”。但也有律师认为,著作权法的宗旨在于“鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进社会主义文化和科学事业的发展与繁荣”。承认ChatGPT生成内容的“可作品性”并不与立法宗旨相冲突。
由此可以看出,对ChatGPT生成内容是否构成“作品”的讨论,在司法界、学术界和实务界均有不同的声音:部分专家和学者认为人工智能生成内容(AI Generated Content)符合“作品”构成要件与立法宗旨;但也有部分法官和学者认为,著作权法是为“人类”制定的法律,不能将“机器”生成的内容与之等同。
三、AI作品著作权的归属
如果AIGC可以被认定为作品,那么这些AI生成作品的著作权归属于哪个/些主体?我国《著作权法》第十一条规定,“著作权法属于作者”。作者属于被我国法律体系赋予人格的组织或个人包括自然人、法人以及非法人组织。
AI生成作品产生于AI与用户的信息交互过程。从技术领域的角度来说,AI生成作品的作者是AI,但AI并没有被赋予法律意义上的人格,因而AI不可能成为法律意义上的“作者”。鉴于此,AI生成作品的著作权究竟花落谁家成为了我国著作权领域百家争鸣的话题:一种观点认为,英国《1988年版权、外观设计和专利法》第9条第3款规定,“对于计算机生成的作品,作者应是为这种创作作出必要安排的人”,这就意味着为AI开发重大贡献的软件开发者比任何人都有资格获得著作权法意义上的保护;根据6Pen Art的弹窗提醒,因为6Pen Art的大部分模型都采用了MIT协议开源,所以6Pen Art所生成的作品都属于使用者本人;彭诚信和陈吉栋在《论人工智能体法律人格的考量要素》讨论了AI获得法律人格的可能性,为AI作为创作者获得著作权提供理论基础。
欧洲专利局的一项研究表明,从“功能主义(Functionalist)”的角度出发,如果人工智能生成内容具备足够的独创性,则可以赋予其相应的知识产权。但经过深入的研究后,欧洲专利局发现,如果要赋予AI知识产权下相应的法律人格,欧盟法律体系将会面临大幅度修改。因此专利局拒绝了这一设想。而后,欧盟专利局提出将AI生成作品的著作权赋予“认识并运用AI系统生成内容重要性”的自然人,即将AI生成作品的著作权归属至AI软件使用者名下。
在我国法律并没有对AI作品著作权归属做出明确规定的情况下,我国法院只能根据《著作权法》第3条和第11条有关作品和作者的规定,结合每个案件的特点予以分析。例如,在腾讯诉上海盈讯公司一案中,法院认定由腾讯公司研发的智能写作辅助系统Dreamwriter创作的财经报道文章具有独创性:腾讯主创团队为Dreamwriter生成作品贡献了相应的素材、表达主题以及写作风格;Dreamwriter生成作品体现了腾讯主创团队的特定选择与安排。因此,Dreamwriter生成作品的著作权归属于腾讯主创团队。而在菲林律所诉百度公司案中,原告向数据库输入关键词获得数据库生成的可视分析报告,法院认为该报告属于数据库算法生成结果,原告并未对生成内容进行选择,因此原告因未对内容的生成贡献“独创性”而无法获得AI生成作品的著作权。
通过对比欧盟专利局和中国法院的观点,不难发现,各国立法司法倾向于赋予利用AI将自身思想转化为表达的用户相应的著作权。ChatGPT作为一类AI工具,一方面,ChatGPT需要用户提出问题或发送指令才能生成作品,可以将这种人机交互的过程理解为用户借由ChatGPT将自身思想逐步转化为表达,因此在某些场景下ChatGPT的用户对ChatGPT生成作品可能享有著作权;另一方面,如果仔细分析某些场景下ChatGPT的创作过程(如图三所示),不难发现用户似乎仅贡献了“问题”,而ChatGPT才是真正意义上内容的“创作者”。综上所述,面对ChatGPT生成内容的著作权是否归属用户的问题,应根据具体案件中用户贡献的“独创性”质量高低进行具体分析。
图三:AI根据题目创作的故事
参考文献
微信扫码关注该文公众号作者