NeurIPS 2023 | PropCare: 面向因果关系推荐系统的倾向性估计方法

2023-11-07 05:11

©PaperWeekly 原创 · 作者 | 刘中舟

单位 | 新加坡管理大学博士生

研究方向 | 推荐系统

摘要

本文由来自 Singpore Management University 和 A*STAR 的作者提出了一种估计在 causalily-based 推荐系统中估计 propensity score 的方法。相比传统的推荐系统仅关注用户-商品交互概率，causality-based 推荐系统更关注推荐这个行为对用户-商品交互概率的影响，因此对优化用户、商品和平台侧的利益具有更好的意义。

本文的目的在于试图解决 causality-based 推荐系统中的一个前置的子问题。即在以往提出的 causality-based 推荐系统都在训练和/或推理阶段要求 exposure（即商品是否被推荐/展示）数据以及 propensity（即商品被推荐/展示的概率）已知，而在现实世界中这类数据往往由于技术或隐私原因无法获得，这导致 causality-based 推荐方法无法得到广泛应用。

虽然过去也有一些 propensity 估计的方法被提出，但是他们要么要求 exposure 数据已知，要么因为缺乏合理的约束导致精度不高。在本工作中，作者通过提出一种PropCare（Propensity Estimation for Causality-based Recommendation）方法在一种更为可行的场景下进行 propensity 估计，即不依赖于 exposure 数据。

我们发现，仅仅需要交互数据已知，将 propensity 和商品的流行度以 pair-wise 的形式进行约束，估计出来的结果就可以很好的用于 causality-based 推荐。

简介

推荐系统在商业上的目的包括提高销量或者提高用户参与度，为了达到这个目的，我们通常需要知道过往的用户-商品交互情况，例如商品是否被某个用户点击或者购买。经典的推荐系统范式就是预测用户-商品交互概率，并为用户推荐交互概率最高的商品。但是这些经典方法偶忽略了推荐背后的一个因果逻辑：假如一个商品在不被推荐的情况下用户与之发生交互的概率依旧很高，那我们是否还有必要去推荐它？

为了回答这个问题，过去有许多工作对其进行了研究，相比传统推荐模型只关注用户-商品交互概率的高低，这些工作更关注不同干预下（如推荐或展示一个商品）对用户行为的相对变化（如点击或购买）。这种所谓的变化就是因果效应（causal effect）。这些方法分别计算不同干预措施下的用户行为，然后计算因果效应，并将因果效应最高的商品推荐给用户。这就是 causality-based 推荐系统的范式。

然而，当前的 causality-based 推荐系统假设 exposure 数据（例如在数据集里商品是否被推荐/展示给用户）和 propensity（例如在数据集里商品是否被推荐/展示给用户的概率）是已知的。这与现实情况不符合的，在现实中这类数据通常由于隐私和技术问题难以取得。

因此，本文提出了 PropCare 试图在一种更为现实和可行的场景下完成 causality-based 推荐，即在 expousure 和 propensity 数据未知的情况下，估计出他们的值，从而填补了当前 causality-based 推荐对数据的要求和现实情境下相关数据不可访问之间的不一致性。

之前的虽然也有一些 propensity 估计的方法被提出来，但是他们要么仍然需要 exposure 作为训练标签或已知变量，要么因为缺乏 propensity 和流行度之间的 pair-wise 的约束而不够稳定，本文和之前方法的区别见图一。

具体来说，本文提出一种 pair-wise 的假设，将 propensity 和商品的流行度（popularity）结合并约束，我们便可以在 exposure 数据未知的前提下估计出propensity 的值。本文的贡献包括：

1. 本文填补了已有方法对 exposure/propensity 数据的要求和现实中相关数据可获取性不足之间的空缺；

2. 本文提出了一种 pair-wise 的假设，将商品的 propensity 和 popularity 进行了一定程度的约束，提高了估计的准确性和稳定性；

3. 本文全面分析了 PropCare 的有效性。

▲ 图一：本文方法与以往方法对比

Propensity学习方法

3.1 交互模型

交互模型是一种广泛用于联系 propensity、interaction 和 relevance 之间关系的模型，它将一个用户-商品之间的 propensity（）、interaction（交互概率，）和 relevance（）建模为

因此，在交互数据 interaction 已知的情况，我们可以用 propensity 模型和 relevance 模型对交互概率进行 point-wise 的拟合，如下式里的。

但正如简介里所说，这种简单的估计不能学到有意义 propensity 或是 relevance，因为和是相关联的，单个的 point-wise 损失函数会让两个函数坍缩成一个。这也是为什么以往的 propensity 估计方法在现实场景下并不可用的理由。

3.2 核心假设

根据以往研究 [1] 中得到的观察，越是流行的商品被推荐/展示的概率越高，本文提出了如下假设。

考虑一个用户和一对商品，假设商品比更流行，且两个商品被用户交互的概率相似，那么用户更有可能被推荐/展示给用户。

这个假设的一个直观阐释就是，如果一个用户对商品和商品的交互概率相似的话，但商品被推荐给了用户，商品却没有，一个合理的解释是因为商品更流行。本文提出这个假设，旨在对用户-商品的交互概率上增加一个约束（使两者相似），从而（1）清除交互概率对 exposure 的影响。（2）同时将流行度对推荐/展示的作用与其他因素隔离开来。

为了验证这个假设的可靠性，本文进行了实验验证。具体而言，本文通过调整交互概率的相似度，来观察三个数据集中符合假设的商品对（）的比例，结果见图二。

▲ 图二：假设验证

图二表明，当和足够相似时，所有数据集的样本基本符合假设，这验证了该假设的可靠性。作者将以上假设进行整理，用数学语言表述出来，形成以下的损失函数。

其中是用来控制交互概率的相似性的权重函数，当两者越相似，该 loss 的权重越大，即流行度对 propensity 的约束越强。

3.3 学习Propensity

综上所述，本文使用以下损失函数对 propensity 进行优化。

考虑到和都只对 propensity 进行局部优化，所以本文额外引入一个 Beta 分布，使用 KL 损失函数从全局视角上约束 propensity，以便学到的 propensity 具有更好的稳定性。

当模型训练至收敛时，我们即可以用模型得到用户-商品之间的 propensity 的值。由于 propensity 本身就是 exposure 的概率值，所以我们也可以很容易的通过 propensity 估计得到二进制的 exposure 值。

Casuality-based 推荐

由于本文贡献主要在于提出一种 propensity 的估计方法而不涉及 causality-based 推荐系统本身算法的设计，所以直接使用 DLCE [2] 作为基础推荐模型。由之前的步骤我们可以得到估计的 propensity ，exposure ，如果用它们替换真实值和，我们就可以使用以下的 loss 来优化评分函数。

其中和是超参，用来控制评分函数的分布。因此，在整个 PropCare 的训练过程中我们都不必获得 propensity 和 exposure 的真实值。在训练完成后，对目标用户，我们可以计算出他和候选商品之间的作为排序和推荐的依据。

实验结果

由于 causality-based 推荐系统在评估中需要用到 propensity 和 exposure，故本文在实验里使用了三个仿真数据集，分别为基于 DunnHumby 公开数据生成的 DH_original，DH_personalized 和基于 MovieLens 数据生成的 ML 数据集。虽然为了评估目的，这些数据集都含有 propensity 和 exposure 数据，但本文提出的 PropCare 在训练和推理过程中都无须涉及到它们。

本文包含两个主要实验，分别是利用估计的 exposure 和 propensity 评估 causality-based 推荐的效果（使用 DLCE [2] 作为基础模型），和评估exposure 与 propensity 本身是否准确估计。

▲图三：实验结果，包括 casality-based 推荐的效果指标和 Propensity/Exposure 估计的准确率指标

从 Table 2 中可以看出，利用 PropCare 估计的 propensity 和 exposure，可以达到相当优秀的推荐效果，仅次于利用其真实值（Ground-truth）的推荐。其在 Table 3 的估计准确度比较中也取得了较好的表现。这说明 causality-based 推荐效果受多种因素的影响，包括 propensity 和 exposure 估计准确性的各种指标。为了更进一步地阐明这种影响，作者在图四进行了一系列评估。

▲ 图四：影响 causality-based 推荐效果的因素分析

结果显示，causality-based 推荐效果的好坏对 exposure 是否估计准确更加敏感，propensity 是否准确估计也有影响，但相对不是特别敏感。因此这也解释了为什么图三里 Table3 中即使 PropCare 在 KLD 和 Tau 不是最优的情况下仍然在 causality-based 推荐强于其他 baseline。

结语

本文介绍了 PropCare，一种面向 causality-based 推荐的 propensity 估计方法。相对于以往方法，PropCare 无需以来真实的 propensity 和/或 exposure 数据进行训练和推理，因此具有更高的灵活性和通用性。实验表明，PropCare 能较好的利用优化得到的 propensity 和 exposure 进行 causality-based 推荐并取得优秀的推荐效果。

参考文献

[1] Yang Zhang, Fuli Feng, Xiangnan He, Tianxin Wei, Chonggang Song, Guohui Ling, and Yongdong Zhang. Causal intervention for leveraging popularity bias in recommendation. In Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval, pages 11–20, 2021.

[2] Masahiro Sato, Sho Takemori, Janmajay Singh, and Tomoko Ohkuma. Unbiased learning for the causal effect of recommendation. In Proceedings of the 14th ACM Conference on Recommender Systems, pages 378–387, 2020.

更多阅读