Redian新闻
>
LinkedIn 图数据库 LIquid:为 9.3 亿会员提供实时数据访问

LinkedIn 图数据库 LIquid:为 9.3 亿会员提供实时数据访问

公众号新闻

作者 | Eran Stiller
译者 | 明知山
策划 | 丁晓昀

最近,LinkedIn 分享了其图数据库 LIquid 是如何自动索引和实时访问会员、学校、技能、公司、职位、工作、事件等之间的关系数据的。这个知识图谱被称为 LinkedIn 的“Economic Graph”,有 2700 亿条边,并且还在不断增长,目前每秒处理 200 万次查询。

LinkedIn 将其“你可能认识的人(People You May Know,PYMK)”推荐系统从传统的 GAIA 系统迁移到了 LIquid。这一变化显著改善了每秒查询数(QPS)、延迟和 CPU 利用率。QPS 从 120 增加到 18000,延迟从超过 15 秒下降到平均 50 毫秒以下,CPU 利用率下降了 3 倍以上。LIquid 还引入了新的数据库索引技术,支持实时数据查询,实现了即时推荐。

图片来源:https://engineering.linkedin.com/blog/2023/how-liquid-connects-everything-so-our-members-can-do-anything

上图是系统的架构图,使用了 LIquid,可以以较小的延迟和可接受的硬件成本来执行图查询。通过 LIquid 对 Economic Graph 的查询生成数百个候选对象,并应用第二个排名函数。这个排名函数使用 Venice 的机器学习功能和 Apache Pinot 的分析见解来评分并选择最佳候选对象。过滤步骤为呈现和最终评分准备好了这个排名列表。

LIquid 的设计使其能够伸缩到当前十倍的规模,可以支持 LinkedIn 9.3 亿多会员的有机增长和新的语义领域。它提供 99.99% 的可用性,并可以自动根据图的大小和活动量的增加进行自动伸缩。

图数据库使用基于 Datalog 的可组合声明式查询语言,帮助开发人员高效地访问和使用数据。可组合语言能够让开发人员在现有的特性(叫作模块)上进行构建,声明式语言能够让开发人员专注于表达他们想要开发的东西,而 LIquid 自动化了高效的访问过程。开发人员因此可以快速变更数据集,大大减少了调整和更新数据库所需的时间。

LinkedIn 工程总监 Bogdan Artintescu 描述了 LIquid 的发展路线图:

要让会员能够做更多的事情,我们需要在回答会员的问题方面提供更加完善的能力。我们可以沿着两个方向做出改进。首先,复杂的查询和添加到 Economic Graph 的数据源的多样性将会驱动新特性的开发和呈现。其次,丰富数据将提高推理能力。这可以通过创建派生数据(通过确定性算法或概率机器学习方法)或通过知识图谱(KG)模式中更丰富的语义改进推理来实现。我们计划专注于高性能图形计算和分析,并建立一个 KG 生态系统,让我们的开发人员能够进一步增强会员体验。

LIquid 的成功激励了 LinkedIn 的其他团队和微软的姐妹团队将它作为图数据索引。

原文链接:

https://www.infoq.com/news/2023/06/linkedin-liquid-graph-database/


你也「在看」吗? 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
全球热点!美国百年来最致命的野火!夏威夷山火遇难者身份确认或需时数年!疑点太多,民众愤怒绝望...你好,我是筚(bì)篥( lì)!你是我报答不完的人内部爆料!亚马逊或将为Prime会员提供免费电信服务!夏天的”牛仔裤”!关键词“liquid”Blackpink澳洲演唱会突发状况!成员提前退场,大批华人要求补偿亚马逊为非会员提供生鲜付费送货服务 12城市先试营运AI 原生向量数据库 : 大模型的“黄金搭档”, 能提供“记忆海绵”资管一哥 | 招银理财2023年暑期实习生招聘开启,提供实习+住宿补贴"滚回家吧"拜登“姗姗来迟”访问毛伊岛,遭居民"竖中指"。内部爆料!亚马逊将为Prime会员提供免费电信服务!深度:为什么中国数据库领域没有出现像Snowflake这样的巨头?U签证需时数年无证移民无法合法工作易受「二次伤害」!专为技术写作人员提供的 7 条 Git 技巧 | Linux 中国星图数据:2023年618全网销售数据解读报告Costco严打"寄生会员",用这3方法没会员卡照样买买买!Chanticleer花园,春天感受【广发策略戴康团队】全市场最全策略数据库:八位一体数据库提供实习证明和奖学金!面向本科生、研究生的 AI 夏令营来了!LinkedIn图数据库LIquid:为9.3亿会员提供实时数据访问二 重建“史小”教科书级数据is all you need:1.3B小模型逆袭大模型的秘密ChatGPT 和 OpenAI 都在用的 Redis,是如何从传统数据库升级为向量数据库的?JVM运行时数据区之堆内存一 大桑树下U签证需时数年无证移民无法合法工作易受「二次伤害」动态 | 未如期扩大内阁,政府向部分执政党议员提供“安抚福利”在家就能做埃森哲数据分析线上实习:4小时拿证书,可挂LinkedIn!哈佛认证:这张可挂LinkedIn的数据分析证书,留学生7天可拿法律翻译|欧盟数据保护委员会 (EDPB) 发布最终版《数据主体权利指南——访问权》提供实习证明和奖学金!面向本科生、研究生的 AI 夏令营!为行动不便人员提供上门办理身份证服务,哪些人可以办理?流程是什么?来看解答→预售"秒光"、门票"炒高"、热度"爆表"…起底"演唱会经济"资本局!亲情的呼唤并非所有向量数据库都生来平等 - 找到属于你的向量数据库星图数据:2023年胶原蛋白行业发展分析报告
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。