因果推理相关的图神经网络研究进展
©作者 | 莫燕虎
单位 | 北邮GAMMA Lab
来源 | 北邮GAMMA Lab
OOD推荐系统下的因果表征学习
文章链接:
https://dl.acm.org/doi/pdf/10.1145/3485447.3512251
1.1 简介
现代推荐系统的用户表征都是从其历史交互中学习出来的,这就存在着用户表征变化带来的问题,历史交互会将过时的信息注入到与最新的用户特征相冲突的表示中,从而导致不恰当的推荐。
如下图所示,在 IID 环境下,左边这位女士处于未怀孕的状态,此时她在系统中的点击是鞋子或者衣服等商品。但在 OOD 的环境下,这位女士变成了怀孕的状态,此时之前的历史交互所学到的表征不适用于 OOD 环境下的推荐。
在这项工作中,作者考虑了在用户特征发生变化的 Out-Of-Distribution(OOD)环境中的推荐问题,并为表征学习设定了额外的两个目标:强大的 OOD 泛化能力以及快速的 OOD 适应能力。这项工作从因果关系的角度制定和解决了这两个问题。即将用户的特征转移表述为一种干预,而 OOD 推荐则是干预后的交互概率推测。
1.2 符号声明与问题定义
1.2.1 符号声明
图 2 中的 表示的可观测到的用户 features,如年龄和收入等, 表示不可观测到的用户 features,如爱好等。、 表示潜在的用户倾向,其中 由用户特征 、 共同决定, 仅由 决定。D 表示的是点击或者购买等用户的交互信息。
1.2.2 问题定义
基于 OOD 环境下的推荐系统,文章中定义了两个问题:1. OOD generalization:当干预 已知,即已经知道干预后的用户的交互数据不可用时,模型的泛化能力。2. Fast adaptation:我们假设很少一部分干预后的用户交互数据可以从 OOD 环境中收集到,并评估模型对 OOD 环境的适应速度和准确性。
1.3 方法
在推荐系统中,我们希望通过已有数据最大化如下对数似然估计,即利用用户的表征来预测他想购买的商品。但是由于公式 2 中 不可知,最大化公式 2 中的对数似然较难。文章中利用变分推断得到公式 2 的证据下界(ELBO),如公式 3 所示。
最大化公式 3 中 ELBO 则可以提高公式 2 的上界,为了计算公式 3 中的 ELBO,文章中采用了 encoder 网络和 decoder 网络去拟合公式 3 中的 and 。
首先利用公式 4 拟合 ,即给定已知的交互数据 d 和用户表征 ,得到不可观测的用户表征 。
再利用公式 5(decoder network),来拟合公式中的 ,由于积分计算起来较为复杂,文中采用公式 7 中的蒙特卡洛采样来近似 。
在训练阶段,可以利用用户 ,和历史交互信息 d,以及 target d 来进行训练,从而得到 figure 4 中四个 MLP 的参数。
在 OOD 环境下的测试阶段,因为 的采样和历史信息 d 有关,这也会可能将一些 IID 场景下的过时信息传递给下游的 。因此,为了避免 IID 数据带来的影响,作者采用 对 d 进行干预(图4 (b)),使得生成的下游 不受过时信息的影响。由于生成的 是在 的情况下得到的,对 对推断保留了原始的一些有用的信息。最后结合二者得到最终的推荐交互 。
1.4 实验
学习图上因果不变表征分布外泛化
文章链接:
https://openreview.net/pdf?id=A6AFK_JwrIW
2.1 简介
2.2 通过因果的视角看图上的OOD泛化
2.2.1 问题定义
2.2.2 图生成过程
(1)本文假设一张图的生成过程是由两个部分和三个函数组成(Assumption 2.1),C 表示图上不变的部分、S 表示图上变化的部分。 继承了 C 中不受环境 E 影响不变的信息, 表示 G 中会随着 E 的变化而变化的部分,其他三个 f 表示数据的生成函数。
(2)遵从以前的工作,本文根据 C 和 S 之间潜在的关系,得到了完全信息不变性的 SCM(FIIF,图2(b))和部分信息不变性的 SCM(PIIF,图2(c)),即 FIIF 表示 C 中包含了所有与标签 Y 有关的信息,PIIF 表示 C 中只包含了标签 Y 的部分信息。
2.3 方法
为了使 GNN 能够学习从 G 中提取关于 C 的信息,本文提出了 CIGA 框架,明确地与假设 2.1 中的两个因果机制 和 对齐,即优化下面的公式 1:
最大化互信息相当于最小化损失函数 ,同时让得到的 与环境 独立等同于通过函数 提取出与图上环境无关、不变的部分。
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:[email protected]
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者