团队提出了一种利用人脸相关任务的特征级先验知识的表征攻击检测方法。首先,我们交换了表征攻击检测(人脸防伪)模块和人脸相关任务在人脸系统中的位置。从人脸相关任务中直接获得的任务特定特征包含丰富的泛化知识,通过使用基于图神经网络(GNN)的跨模态适应器,将任务特定特征重新映射并使其适应 PAD 任务。本文所提方法通过缓解训练中攻击样本有限的问题,最终提高了模型的泛化能力。
算法细节
如图 2 所示,所提出方法由两个分支组成,包括基于 CNN 的 PA 检测器和一个辅助分支。PA 检测器通过直接从图像空间中提取特征来区分攻击样本和真实人脸之间的差异。辅助分支旨在从训练好的人脸相关任务模型中提取人脸相关特征。
在辅助分支中,我们首先从人脸相关任务模型的多个网络层中分层地获得任务特定特征(Task Specific Features)。然后,我们设计了一个基于 GNN 的跨模态适应器,以适应 PAD 任务。来自两个分支的特征将被完全融合输入到分类器中,用于最终的 PAD。
Half Total Error Rate (HTER), Area Under Curve (AUC), Bona Fide Presentation Classification Error Rate (BPCER) (when Attack Presentation Classification Error Rate is 1%)
3)基于人脸相关任务的PAD性能对比:
本文使用以下五种不同的常见人脸相关任务模型作为辅助分支网络 :人脸识别(Face Recognition, ),人脸表情识别(Face Expression Recognition, ),人脸检测(Face Detection, ),人脸定位(Face Localisation, ),人脸属性编辑(Face Attribution Editing, )。如表1所示,不同的人脸相关任务都可以显著提升 PA 检测器(Baseline)的检测性能。例如, 为人脸属性编辑模型时,所提方法在使用 C, I 数据集训练,O, M 数据集测试中的 HTER 仅为 13.18%,AUC 可以达到 94.36%。 ▲ 表1. FRT-PAD使用不同人脸相关任务时的性能。4)与SOTA方法的性能对比
如表2所示,在三个数据集作为训练集,剩余一个数据集作为测试集时,本文方法可以取得 SOTA 效果。其中,使用 O, C, I 数据集训练,M 测试时,本文方法 HTER 可以达到 5.71%,显著提升了 PAD 性能。
▲ 表2. 三个数据集作为训练集时的跨数据集PAD性能对比。
为增加实验难度,我们减少训练集数量,仅使用两个数据集作为训练集,剩余一个作为测试集。如表 3 所示,本文方法仍然可以达到 SOTA 效果。
▲ 表3. 两个数据集作为训练集时的跨数据集PAD性能对比。
我们认为上述实验验证了本文方法与训练所需数据的依赖程度较低,并且本文方法可以有效增强 PAD 模块的泛化性能。
可视化结果
▲ 图4. 在CASIA-FASD数据集上的Grad-CAM可视化结果。
我们进一步使用 Grad-CAM 对本文 FRT-PAD 模型中 PA 检测器 和三种人脸相关任务网络 得到的特征图进行可视化。跨模态适应器使用 Step-by-Step Graph。如图 4 所示,当使用人脸相关特征时,该模型可以找到 Bona fide 样本和 PA 样本的辨别特征。在从 获得的可视化区域中,显示头发、眼睛、鼻子和嘴巴对于区分真实人脸和表征攻击十分重要。这进一步表明了人脸相关任务特征的有效性。