Facebook推荐系统研究新进展：结合多模态信息与排名式学习的搜索EBR系统

2023-08-29 14:08

©PaperWeekly 原创 · 作者 | 田雨鑫

单位 | 加州大学默塞德分校

研究方向 | 计算机视觉，多模态学习

近年来，基于嵌入的检索（EBR）在电商搜索引擎领域取得了显著的进步。尽管 Meta 提出的 Que2Search 和其他现有的 EBR 系统在实际应用中取得了一定的效果，但仍面临一些挑战：

这些系统通常优化的是查询和产品的语义相关性，但这并不意味着产品一定能吸引搜索，可能会出现相关性高但用户参与度低的情况。

另外，产品的价格、生产条件、卖家评分等上下文信息也非常重要。但是如何将这些上下文信息融入到搜索 EBR 系统中并非易事：传统的基于对比学习的 EBR 建模技术过分强调语义相关性，所以简单地在对比学习设置中应用上下文信息可能并不会奏效。同时，找到既语义相关又能吸引搜索者的产品是一项挑战。

基于这些问题，Meta 的研究团队提出了 Que2Engage，进一步发掘了 EBR 的潜力，并且引起了社区广泛的关注。与传统的 EBR 模型相比，Que2Engage 不仅能够返回与搜索查询语义相关的产品，还能提升那些更能吸引搜索者的产品的排名，这对于满足复杂的商业目标和改善用户体验具有巨大的价值。

论文主页：

https://dl.acm.org/doi/pdf/10.1145/3543873.3584633

该模型的前身 Que2Search 在 KDD 上发表，并获得了广泛关注。Que2Engage 的优势主要体现在以下几个方面：

多模态方法：将产品价格、生产条件、卖家评分等上下文信息视为独特的模态并融入到系统中，以更全面地满足搜索者的需求。
多任务学习：通过同时进行对比学习和排名式学习，既可以找到与查询语义相关的产品，又能提升用户参与度。
多任务评估：通过对现有 EBR 模型进行多任务评估，我们可以更深入地理解其在不同领域的性能，并能够准确地评估 Que2Engage 在应对实际挑战时的有效性。
实践应用：已在 Facebook Marketplace 搜索中集成，并每日支持数百万次搜索查询。在两周的在线 A/B 测试中，Que2Engage 已经表现出了显著的改进，有效提高了用户的参与度。

方法

1. 多模态搜索 EBR 系统：Que2Engage 采用了多模态方法，通过其 Transformer 融合骨架将产品价格、生产条件、卖家评分等上下文信息纳入模型中。这些上下文信息被视为独特的模态，可以帮助系统更好地理解搜索者的需求，并找到更符合搜索者需求的产品。

2. 多任务学习：Que2Engage 通过多任务学习同时进行对比学习和排名式学习。对比学习用于找到与搜索查询语义相关的产品，而排名式学习则用于提升那些更能吸引搜索者的产品的排名。这两种学习方法的结合，使得 Que2Engage 不仅能找到相关的产品，还能提高用户的参与度。

对比学习：为了学习语义相关性，模型采用基于批量负采样的对比学习作为训练目标。其中，正样本是从搜索日志中采样的用户参与的 < 查询，产品 > 对（q, d），而负样本则是在正样本的小批量内。

排名式学习：尽管批量负采样在搜索 EBR 问题中已经证明对学习语义相关性很有用，但它在学习与用户参与度相关的上下文信息方面并不足够。在批量负训练期间，模型从那些价格非常不合理的产品中获得的负反馈很少，因为所有的负样本都是从参与的 <查询，产品> 对中生成的。因此，que2engage 提出了一个辅助训练任务，直接优化模型以在相关产品中找到用户参与的产品。

3. 多任务评估：为了更深入地理解 EBR 模型在不同领域的性能，Que2Engage 引入了多任务评估。通过对现有 EBR 模型进行多任务评估，可以更准确地评估 Que2Engage 在处理实际挑战时的有效性。

实验

Que2Engage 在 Facebook Marketplace 搜索中的应用已经证明了其优越的性能。在两周的在线 A/B 测试中，Que2Engage 已经表现出了显著的改进，有效提高了用户的参与度。

结论

在电子商务搜索引擎领域，搜索的相关性和用户参与度的平衡已经成为一项关键的挑战。Meta 的研究团队通过 Que2Engage 为这个问题提供了一个前沿的解决方案。这个模型巧妙地将多模态信息与对比学习和排名式学习结合起来，不仅强调了与查询的语义相关性，还深入挖掘了用户的真实需求和参与意愿。

实验结果证明，通过融合上下文信息如产品价格、生产条件、卖家评分等，并结合多任务学习的方法，Que2Engage 已经在 Facebook Marketplace 上实现了显著的效果提升，为提高用户体验和商业价值提供了有力的工具。在未来，随着技术的进一步发展和优化，我们预期此类系统将在更多的电商平台上得到广泛的应用，为用户带来更加个性化和高效的购物体验。

更多阅读