迪士尼笑了!陈丹琦团队最新研究,打造AI"版权护盾",AI创新不侵权
作者 | Richard
想必大家都听说过南山必胜客的威名,但在国门之外,还有个更硬核的存在——号称"版权狂魔"的迪士尼法务部。这个看似人畜无害的企业,实则凶残得很。
有个调侃说法流传甚广:假如马特·达蒙不慎被困火星,想要以最快速度获救,他只需在火星表面涂鸦一个巨大的米奇头像,然后悠哉地等待迪士尼法务部乘坐火箭呼啸而至,以雷霆万钧之势对他提起侵权诉讼。这听起来像是无厘头笑话,但迪士尼法务部过往的彪悍战绩足以让人相信——但凡侵犯迪士尼版权,管你是在地球还是外太空,都逃不过被起诉的命运。
然而,在这个AI技术日新月异的时代,连迪士尼这样的"版权守护神"也遇到了新的挑战。
近期研究揭示,AI生成模型仅需几个关键词就能创造出酷似版权角色的图像,甚至能轻松绕过现有的商用系统防护。举个例子,只需输入几个简单的词语,AI就能生成酷似迪士尼角色的图像。这种情况轻则踩到版权的红线,重则可能收到迪士尼的警告函——想必连马特·达蒙听到这个消息都会捏一把冷汗。
就在迪士尼法务部可能正在为此焦头烂额之际,普林斯顿大学计算机科学系助理教授陈丹琦及其研究团队针对AI模型可能产生的版权问题提出了创新性解决方案。 作为自然语言处理和机器学习领域的新秀,陈丹琦虽然年轻,但已在学界崭露头角,俨然是AI界的"米奇新星"。
陈丹琦带领团队开发的新方法,巧妙地结合了提示词重写技术与负面提示词策略,堪称AI领域的"版权护盾"。这种方法旨在生成过程中主动规避使用受保护的内容,既保障了创新,又尊重了知识产权,可谓是在迪士尼的火眼金睛下开辟了一条新路。
这项技术为AI内容生成中的版权问题提供了一个既能有效降低侵权风险,又能保持生成内容质量的实用解决方案。它展示了在保护知识产权与发挥AI创造力之间寻求平衡的可能性,就像是在数字世界里重现了米奇和唐老鸭的和谐共处。
论文标题:
Fantastic Copyrighted Beasts and How (Not) to Generate Them
论文链接:
https://arxiv.org/pdf/2406.14526
版权保护的新挑战:AI生成模型的崛起
近年来,AI生成模型在内容创作领域展现出惊人的能力,但同时也带来了版权保护的新挑战。研究人员开发了COPYCAT评估套件,包含50个来自18个工作室的流行版权角色,用于系统性评估这一问题。
研究发现,即使不直接使用角色名称,AI模型也能通过"间接锚定"生成酷似版权角色的图像。如上图左侧所示,仅用"视频游戏"和"水管工"等简单描述,就能生成酷似马里奥的图像。这一现象在多个主流AI模型中普遍存在,包括开源模型和商用系统如DALL·E 3。
这个问题不仅存在于游戏角色,同样存在于电影角色。如上图右侧所示,即使不直接使用"Batman"作为提示,Playground v2.5和DALL·E 3同样可以生成蝙蝠侠的图像。
这些发现凸显了AI生成模型在版权保护方面面临的挑战,涉及技术、法律和伦理等多个层面。如何在发挥AI创造力的同时保护原创者权益,成为了一个亟待解决的问题。
从无意到有意:识别生成版权角色的关键词
陈丹琦团队开发了一种创新的两阶段方法来识别可能触发AI生成版权角色的关键词:
生成阶段
使用GPT-4生成与目标角色相关的50个候选关键词和一个60词左右的描述。这确保了有足够多样化的词汇来测试AI模型。
排序阶段
研究者采用了三种不同的排序方法:
嵌入相似度(embeddingsim):计算候选词与角色名称在嵌入空间中的相似度。具体来说,对于每个候选词 和角色名 ,计算其相似度:
其中 是文本编码器, 表示点积。
共现频率(co-occurrence):统计候选词与角色名称在训练语料中的共现频率。
语言模型排序(LM-RANKED):使用语言模型直接生成最相关的关键词。
研究团队还引入了两个关键指标来评估生成结果:
DETECT:计算成功生成目标版权角色的次数。
其中 是生成模型, 是提示方法, 是缓解策略, 是角色集合, 是检测函数。
CONS:衡量生成图像与用户意图的一致性。
其中 是角色 的主要特征, 是一致性评分函数。
下图直观地展示了不同关键词选择方法的效果。横轴表示使用的关键词数量,纵轴表示成功生成的版权角色数量(DETECT分数)。从图中可以清楚地看到,基于LAION数据集的共现频率(CO-OCCURRENCE-LAION)方法表现最佳,即使只使用5个关键词,其效果也接近于使用60词的详细描述。
对于马里奥角色,右侧显示了60词的描述,左侧分别展示了三种方法选出的top-5关键词。CO-OCCURRENCE方法生成的关键词如"Nintendo"、"Bowser"等,虽然不直接描述马里奥的外观,但能有效触发模型生成相关图像。
好的,我会根据您的要求,对实验部分进行简洁但全面的描述,涵盖文章和附录中的所有实验图表。
实验结果:从发现问题到解决问题
研究团队进行了一系列实验,不仅验证了他们的发现,也提出了一些可能的解决方案。
版权角色生成的普遍性
在没有干预的情况下,Playground v2.5模型能生成30.33个版权角色,而在应用提示词重写和负面提示后,这个数字降至4.33。其他模型如Stable Diffusion XL、PixArt-α等也显示了类似的趋势。
上图还展示了各种缓解策略的效果。结合提示词重写和负面提示的方法最为有效,将DETECT分数从30.33降至4.33,同时保持了较高的CONS分数(0.81)。
间接锚定的效果
下图比较了不同关键词选择方法的效果。基于LAION数据集的共现频率方法表现最佳,仅使用20个关键词就能超过60词描述的效果。
模型对角色名称的敏感性
下图生动展示了模型对角色名称拼写的敏感性。当完整使用角色名称时,模型能准确生成相应角色。然而,随机替换角色名称中的3个字母会导致生成成功率大幅下降,仅能生成1个角色。这表明模型高度依赖精确的角色名称来触发特定生成,这一发现对于设计更有效的版权保护策略具有重要意义。
DALL·E系统的表现
即使是DALL·E 3这样的先进商用系统,也可能被精心设计的描述词"欺骗",生成类似版权角色的图像。这说明当前的商业系统在版权保护方面仍存在漏洞,需要更强大的防护机制。研究发现,60词的描述能绕过DALL·E的内置安全措施,生成酷似蜘蛛侠、索尼克等版权角色的图像。
视频生成模型的结果
下图展示了VideoFusion模型使用5个LAION关键词生成的版权角色视频帧,包括艾莎、闪电麦昆等角色。这表明版权问题不仅存在于静态图像生成,也延伸到了视频生成领域。研究发现,视频生成模型在使用间接锚定方法时,表现与图像生成模型类似,这为视频领域的版权保护提供了重要参考。
人工评估结果
Cohen Kappa分数矩阵显示,人类评估者之间达到了显著的一致性(Kappa值在0.6~0.8之间)。GPT-4V与人类评估者的一致性略低,但仍达到了实质性的一致水平。这验证了使用GPT-4V作为评估工具的可靠性。
嵌入相似度分析
研究团队分析了文本描述与角色名称的嵌入相似度对生成结果的影响。他们发现,相似度较高的描述更容易触发目标角色的生成。在100个随机描述中,相似度最高的能生成26个目标角色,而最低的仅生成16个。这一发现为优化提示词重写策略提供了新思路,暗示通过降低重写后提示词与原角色名称的相似度,可能会进一步降低生成版权角色的风险。
这些实验结果不仅验证了研究团队的发现,也为解决AI生成模型中的版权问题提供了重要的实证基础和可能的解决方向。
AI创意与版权的"猫鼠游戏"
在人工智能与版权法规的持续角力中,创新与伦理不断交织。
普林斯顿大学陈丹琦团队开发的新方法巧妙结合了提示词重写和负面提示技术,为这场博弈带来了新的解决方案,正在重塑对创造力本质的理解,同时探索如何在数字时代更好地保护和激励创新。
微信扫码关注该文公众号作者