Redian新闻
>
Facebook推荐系统研究新进展:结合多模态信息与排名式学习的搜索EBR系统

Facebook推荐系统研究新进展:结合多模态信息与排名式学习的搜索EBR系统

科技

©PaperWeekly 原创 · 作者 | 田雨鑫

单位 | 加州大学默塞德分校

研究方向 | 计算机视觉,多模态学习

 

近年来,基于嵌入的检索(EBR)在电商搜索引擎领域取得了显著的进步。尽管 Meta 提出的 Que2Search 和其他现有的 EBR 系统在实际应用中取得了一定的效果,但仍面临一些挑战:


这些系统通常优化的是查询和产品的语义相关性,但这并不意味着产品一定能吸引搜索,可能会出现相关性高但用户参与度低的情况。


另外,产品的价格、生产条件、卖家评分等上下文信息也非常重要。但是如何将这些上下文信息融入到搜索 EBR 系统中并非易事:传统的基于对比学习的 EBR 建模技术过分强调语义相关性,所以简单地在对比学习设置中应用上下文信息可能并不会奏效。同时,找到既语义相关又能吸引搜索者的产品是一项挑战。


基于这些问题,Meta 的研究团队提出了 Que2Engage,进一步发掘了 EBR 的潜力,并且引起了社区广泛的关注。与传统的 EBR 模型相比,Que2Engage 不仅能够返回与搜索查询语义相关的产品,还能提升那些更能吸引搜索者的产品的排名,这对于满足复杂的商业目标和改善用户体验具有巨大的价值。


论文主页:

https://dl.acm.org/doi/pdf/10.1145/3543873.3584633


该模型的前身 Que2Search 在 KDD 上发表, 并获得了广泛关注。Que2Engage 的优势主要体现在以下几个方面:

  1. 多模态方法:将产品价格、生产条件、卖家评分等上下文信息视为独特的模态并融入到系统中,以更全面地满足搜索者的需求。

  2. 多任务学习:通过同时进行对比学习和排名式学习,既可以找到与查询语义相关的产品,又能提升用户参与度。

  3. 多任务评估:通过对现有 EBR 模型进行多任务评估,我们可以更深入地理解其在不同领域的性能,并能够准确地评估 Que2Engage 在应对实际挑战时的有效性。

  4. 实践应用:已在 Facebook Marketplace 搜索中集成,并每日支持数百万次搜索查询。在两周的在线 A/B 测试中,Que2Engage 已经表现出了显著的改进,有效提高了用户的参与度。



方法

1. 多模态搜索 EBR 系统:Que2Engage 采用了多模态方法,通过其 Transformer 融合骨架将产品价格、生产条件、卖家评分等上下文信息纳入模型中。这些上下文信息被视为独特的模态,可以帮助系统更好地理解搜索者的需求,并找到更符合搜索者需求的产品。

2. 多任务学习:Que2Engage 通过多任务学习同时进行对比学习和排名式学习。对比学习用于找到与搜索查询语义相关的产品,而排名式学习则用于提升那些更能吸引搜索者的产品的排名。这两种学习方法的结合,使得 Que2Engage 不仅能找到相关的产品,还能提高用户的参与度。

对比学习:为了学习语义相关性, 模型采用基于批量负采样的对比学习作为训练目标。其中,正样本是从搜索日志中采样的用户参与的 < 查询,产品 > 对(q, d),而负样本则是在正样本的小批量内。
排名式学习:尽管批量负采样在搜索 EBR 问题中已经证明对学习语义相关性很有用,但它在学习与用户参与度相关的上下文信息方面并不足够。在批量负训练期间,模型从那些价格非常不合理的产品中获得的负反馈很少,因为所有的负样本都是从参与的 <查询,产品> 对中生成的。因此,que2engage 提出了一个辅助训练任务,直接优化模型以在相关产品中找到用户参与的产品。

3. 多任务评估:为了更深入地理解 EBR 模型在不同领域的性能,Que2Engage 引入了多任务评估。通过对现有 EBR 模型进行多任务评估,可以更准确地评估 Que2Engage 在处理实际挑战时的有效性。



实验


Que2Engage 在 Facebook Marketplace 搜索中的应用已经证明了其优越的性能。在两周的在线 A/B 测试中,Que2Engage 已经表现出了显著的改进,有效提高了用户的参与度。



结论


在电子商务搜索引擎领域,搜索的相关性和用户参与度的平衡已经成为一项关键的挑战。Meta 的研究团队通过 Que2Engage 为这个问题提供了一个前沿的解决方案。这个模型巧妙地将多模态信息与对比学习和排名式学习结合起来,不仅强调了与查询的语义相关性,还深入挖掘了用户的真实需求和参与意愿。

实验结果证明,通过融合上下文信息如产品价格、生产条件、卖家评分等,并结合多任务学习的方法,Que2Engage 已经在 Facebook Marketplace 上实现了显著的效果提升,为提高用户体验和商业价值提供了有力的工具。在未来,随着技术的进一步发展和优化,我们预期此类系统将在更多的电商平台上得到广泛的应用,为用户带来更加个性化和高效的购物体验。


更多阅读



#投 稿 通 道#

 让你的文字被更多人看到 



如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。


总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 


PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。


📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算


📬 投稿通道:

• 投稿邮箱:[email protected] 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿


△长按添加PaperWeekly小编



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·
·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
颜宁团队的研究新进展!关于大麻喜报 |施一公团队研究新进展、必扬医药完成数千万元PreA轮融资理论实操并行,结合多元文化+留学申请|iWanna第五期《心理咨询基础技能课》升级啦!实现输入到输出「模态自由」, NUS华人团队开源NExT-GPT,最接近AGI的大一统多模态大模型来了墨尔本毒蘑菇案最新进展:死者发出的最后一条信息曝光Nature Medicine | 临床研究新进展!复旦大学联合华大为食管癌治疗提供参考乡村女教师不同小猫的搜索记录更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」从零训练一个多模态LLM:预训练+指令微调+对齐+融合多模态+链接外部系统重磅!再次登顶 Nature,张锋团队研究新进展!智源Emu开源!超越DeepMind,刷新8项SOTA,首个「多模态-to-多模态」全能高手多模态大语言模型综述来啦!一文带你理清多模态关键技术八十六 郭老智能超表面辅助移动通信系统信道状态信息获取 | NSR综述日本七大著名人文景点Redox Biology | 何玲/孙逸团队合作发表阿尔兹海默症治疗药物研究新进展TKDE 2023 | 超越共现!大连理工提出全新多模态会话推荐系统腾讯AI Lab发布多模态指令调优语言模型,支持图像、视频等四种不同模态破解一切模态,无限接近AGI!新加坡华人团队开源全能「大一统」多模态大模型你猜,为什么Google和Facebook不用Docker?必看!盘点赴美国际学生最热门的专业与排名!德州人对奢侈品牌的搜索量全美第一回国见闻 – 微信支付八十五 捕鱼基于多模态学习的虚假新闻检测研究上海内推 | 小红书多模态算法组招聘多模态CV/NLP算法实习生曝OpenAI大模型新进展!将推出多模态大模型,新项目Gobi筹备中多模态搜索算法如何让视频搜索更精准?腾讯独家揭秘,超详细NTU-TOM教授:AI算法在餐饮推荐系统中的应用与优化|收获一作论文与导师推荐信!重磅课程再次升级,一次性搞定大模型多模态AIGC与强化学习 --《2023秋季AIGC大模型与强化学习前沿技术实战》 招生简章关注血脂残余风险——2023血脂领域研究新进展|CIT 2023解锁 Serverless 新进展:与 AIGC 结合会有哪些搞头?阿里公开文生图研究新进展,提出组合式的多概念定制生成方法存储系统研究综述(收藏)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。