Redian新闻
>
ACM MM2022|腾讯基于自适应区域选择和通道参考的视频盲水印,高效对抗各类攻击

ACM MM2022|腾讯基于自适应区域选择和通道参考的视频盲水印,高效对抗各类攻击

公众号新闻

机器之心专栏

机器之心编辑部

数字水印技术由于其隐蔽性、安全性的天然优势,广泛应用于多媒体盗版侵权确认、泄密溯源、隐秘通信等场景。本文中,腾讯 AI 技术中心的研究者介绍了一种基于自适应区域选择和通道参考的视频盲水印算法,相关工作已被 ACM MM2022 接收。



论文链接:https://arxiv.org/abs/2209.13206


1 背景介绍


数字水印是一种将信息隐藏到多媒体载体中的技术,人们难以感知水印嵌入后载体的变化,也无法直接获取水印信息,只有生产方通过专门的检测工具才能正确提取水印信息。相比于传统明水印方案,数字水印的隐蔽性更好、安全性更强,广泛应用于盗版侵权确认、泄密溯源等领域。



以往数字水印技术对于一般的信号处理攻击(压缩、滤波和噪声)有比较好的解决方案,但是随着智能手机性能的提升,手机拍照录屏越来越方便,利用手机拍照录屏泄密的事件时有发生。屏摄引入的失真极其复杂,包括伽马变换、JPEG 压缩和透视失真等一系列复杂失真,很大程度地抹除了水印信息,所以如何提升抗屏摄能力是当前数字水印关键难题。


本文设计了一种利用纹理信息和 ORB 特征自适应选择嵌入区域的抗屏摄视频盲水印算法,实验表明本算法在保证高画质前提下实现了很强的鲁棒性——可抵抗编码压缩、几何攻击和屏摄攻击


本文创新和贡献:


  • 设计了一种基于纹理信息和特征点的自适应区域选择方法,减少了对图像质量的影响,保证了水印检出率;

  • 考虑到人类对特定颜色分量的不敏感,提出了一种基于通道参考的水印嵌入策略,通过修改中低频来确保更高的鲁棒性和更少的图像质量损失。


2 方法介绍


本文水印算法嵌入和检出的整体架构如下图 1 所示:


图 1 水印嵌入检出架构图


2.1 区域选择策略


图像内容主要集中在低频区域,细节集中在高频区域。在视频编码过程中,高频系数容易被量化,水印嵌在高频区域容易被抹除;而水印嵌入在低频系数中又对画质会产生可感知影响。根据以上分析,本文基于纹理信息和 ORB 特征点来选择适合嵌水印的区域,不仅减少对画质的影响,而且增加了水印的稳定性


2.1.1 根据纹理因子选取


纹理因子是使用图像内容信息去挑选合适的区域嵌水印,其思路与 H264 编码规则相一致,即将图像分成 4x4 或 8x8 的宏块,宏块系数会根据运动信息进行量化和压缩,根据纹理因子可以尽可能地避免挑选到被大幅度压缩的宏块,从而更稳定的保留水印信息。纹理因子的计算公式为:



通常,复杂纹理区域的 Rf 和 Ef 的值大于其他区域,在不同程度的压缩量化之后能保留更多信息。


2.1.2 根据 ORB 特征点选取


尽管纹理因子能够帮助挑选一些稳定的宏块嵌入水印信息抵抗编码压缩攻击,然而对于几何攻击和录屏等攻击,水印信息还很难完整地保留下来。ORB 特征值越大的区域对几何攻击更鲁棒,在此区域嵌入的水印信息更容易保留。因此,在利用纹理因子挑选稳定宏块的基础上,根据 ORB 特征点挑选更稳定的区域


直接选取特征值大的宏块,会导致可选宏块聚集在一个很小的区域,当遭遇到裁剪或马赛克等攻击时,水印信息可能损失过多无法检出,所以有必要尽量分散地选取满足要求的 ORB 特征点。


直接计算 ORB 特征点


本文提出特征点局部聚类方法对特征点进行筛选,以每个特征点为中心,作 R 为半径的圆,只有该区域特征值最大的特征点被保留,其他特征点全部被丢弃(对于 8x8 的宏块,半径 R 设定为 4 可确保每个圆形区域能够容纳下 8x8 的宏块)。


局部聚类后 ORB 特征点


纹理因子倾向于选择对压缩量化更稳定的宏块,而 ORB 特征点倾向于选择几何攻击更稳定的宏块,选择能够同时满足以上两个要求的宏块,即取两者选取宏块的交集作为最终嵌水印的区域。



2.2 水印嵌入


水印信息嵌在了中低频系数,增强了水印的鲁棒性,将系数修改幅度平摊到多个系数上,减少了对画质的影响,并且考虑到视频编码压缩的影响,利用连续的 K 帧嵌入相同的比特信息。本文水印嵌入方式的优点:


  • 通常方法为了保证鲁棒性,会在低频区域修改某个系数嵌入水印。而本方法是同时修改多个中低频系数,因为常见攻击只会影响部分系数,这样即使部分系数发生变化依然可以检出水印;

  • 由于同时修改多个系数嵌入水印,可以选择修改不同中低频位置的系数,有效降低对画质的影响,并且在鲁棒性和图像画质之间有一个很好的平衡。


水印嵌入步骤:


1)利用 Arnold 算法对水印序列进行置乱;

2)解码视频帧并转换到成 RGB 格式;

3)根据 2.1 中所述方式选取宏块作为嵌入候选区域;

4)选取蓝色通道嵌入水印,绿色通道作为参考通道。分别对蓝色通道和绿色通道行 DWT 和 DCT 变换得到一对系数矩阵,分别记作 f_B 和 f_G;

5)分别选取系数矩阵 f_B 和 f_G 的一段中频系数求和,记作,求差值 delta;

6)根据差值 delta 和嵌入比特信息确定修改  的修改值;

7)计算每个中频系数的修改量,并修改对应系数;

8)对修改后的系数矩阵进行进行 IDCT 和 IDWT 变换得到嵌水印图像块。


2.3 检出流程


水印提取是水印嵌入的逆过程:先找到嵌入水印的块,然后进行 DWT 和 DCT 变换,再根据频率系数修改规则判断嵌入信息是 + 1 还是 - 1。由于嵌入水印的区域对于编码压缩、几何攻击和录屏具有一定的鲁棒性,所以对于待检测视频,依然按照嵌入时的策略选取 block 块进行检测。


水印提取步骤:


1)对待检视频进行解码得到视频帧,视频帧转换到 RGB 色彩空间;

2)按照 2.1 中所述方式选取 block 块作为待检块;

3)对 2)中选取的每个 block 块的蓝 / 绿通道进行 DWT 和 DCT 得到系数矩阵 f_B 和 f_G,对嵌入时对应的中频系数求和得到

4)根据系数和的关系确定水印信息为 1 或 - 1;

5)重复步骤 3 和 4,直至所有选取的 block 块检测完毕。


3 实验


本文选取了 5 个视频,其中 3 个视频 (News、Foreman 和 Mobile) 被用于很多水印方法的测评中,但视频分辨率较低,所以另外从腾讯视频库中选取了 2 个高质量视频,视频详细信息如下所示:



采取 PSNR 作为画质评测指标,位错误率(bit error rate, BER)作为鲁棒性评测指标,攻击分为常规信号处理攻击屏摄攻击


3.1 画质


本文与其他方法进行了画质对比,由于其他方法都是将水印嵌入了 YUV 空间的 Y 通道,而 Y 通道包含了所有亮度信息,修改 Y 通道会同时影响 RGB 三个通道,因此对画质影响更严重。


另外,我们没有大幅度修改单个低频系数,而是对多个中低频系数进行小幅度修改,对画质影响更小。如下表所示,我们的方法取得了更好的画质。



3.2 鲁棒性


除了针对常见的编码压缩、旋转、缩放、裁剪等信号处理攻击,本文还测试了帧率变换和屏摄等复杂攻击。


iPhone 13 屏摄示例


对于旋转、裁剪、缩放和投影变换等几何攻击,本方法提取水印 BER 在 1% 左右,对于时序滤波、帧率变化等时序攻击也均优于其他方法。



对于屏摄攻击,无论对于低画质视频 (b) 和高画质视频,本文方法均具有比较好的鲁棒性,BER 为 1.3%~2.2%,远低于其他方法。

 


消融实验


为了进一步证明本文方法的有效性,本文对比了分别使用纹理因子和 ORB 特征挑选嵌入区域对水印鲁棒性的影响。



无论是鲁棒性和画质,同时使用两种策略选择嵌入区域都要好于单独使用任一策略。主要是由于单独使用一种策略选择的嵌入区域较多,则修改的区域更多,画质影响更严重。


3.3 性能


AMD EPYC 7K62 8G 下测试,1080P 单帧耗时 50ms,通过控制选择宏块数量最低可实现 28ms / 帧,60s 视频检出耗时 50s。


4 总结


本文提出了一种基于自适应区域选择和通道参考的强鲁棒水印算法,通过分析视频的纹理和特征点等内容信息,选择不易被干扰的区域添加水印。在水印嵌入过程中,根据 HVS 视觉原理,选择修改蓝色通道频域系数而不是亮度分量,有效降低了水印对图像质量的影响。


实验表明,本方法不仅对几何攻击具有很强的鲁棒性,而且对帧率变换等时序攻击和屏摄攻击也有很好的抵抗能力。



© THE END 
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
CIKM2022 | ChiQA-一个基于20万个真实用户问题的图片问答数据集莫纳什大学研制出防过敏新药:每天一次,即可有效对抗花粉热和雷暴哮喘如何合理选择和使用血管活性药物,阜外专家支招!丨CMIT 2022长新冠(Long Covid)的症状与改善身材超“大”只的撸铁辣妹,emmmm….实名羡慕了!测试阶段模型自适应方法总结赋能企业发展,实现高效对接——维犀财经中小企业服务商手册征集中!【立秋】多事之夏过后,还会有多事之秋吗?美国军机侵入海口毛泽东下令打BISFF2022|志愿者招募早鸟报|腾讯收购计划搁浅;天猫双11物流计划曝光;2022年10月10日国内成品油价格不作调整.....ACM MM 2022 Oral | PRVR:全新的文本到视频跨模态检索子任务NeurIPS 2022 | 基于对齐引导时间注意力机制的视频动作识别“每次买腾讯都碰上腾讯回购” 段永平再加仓腾讯 碰上腾讯年内第75次回购互联网大厂|腾讯 客户端开放实习生正在招聘中!SIGGRAPH Asia 2022|告别手Key!上科大提出实时面捕,精细到微表情CIKM2022 | 基于文本增强和缩略-恢复策略的缩略词TransformerFBEC2022| 玩转元宇宙营销,护航品牌抢占下个十年细颈瓶前妻评价细颈瓶ACM MM 2022 Oral | PRVR: 新的文本到视频跨模态检索子任务你会选择和哪种人恋爱结婚,和这种心理特质有关NeurIPS 2022|探明图对比学习的“游戏规则”:谱图理论视角一加 Buds Pro 2 耳机曝光,支持自适应降噪无忧买房|Wellesley单家庭房出售,高评分学区,步行可至Wellesley高中,近镇中心和通勤铁路火车站教育随笔(104)高考文言文备考之五无忧买房|​Westwood单家庭房出售,高评分学区,近I-95高速和通勤火车站NeurIPS 2022|图对比学习的结构公平性初探一文梳理基于梯度的黑盒迁移对抗攻击研究进展【友情转发】DWP2022|重磅嘉宾来袭,你心动了吗?VideoMAE:简单高效的视频自监督预训练新范式|NeurIPS 2022互联网大厂|腾讯 2023校园招聘正在进行中!可远程面试吴晓波:关于读书、选择和目标的思考BISFF2022|NOVA“新星”竞赛单元:想象永恒的未完成时WISE 2022|Long China Long InnovationNature封面:耶鲁大学研究团队设计出一种形态自适应的仿生两栖海龟机器人
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。