Redian新闻
>
Yelp 的 Apache Cassandra 集群重建解决方案

Yelp 的 Apache Cassandra 集群重建解决方案

科技

作者 | Rafal Gancarz
译者 | 明知山
策划 | 丁晓昀

Yelp 构建了一个解决方案,利用其数据流架构来清理来自已损坏的 Apache Cassandra 集群的数据。提供解决方案的团队探索了许多可能的选项来解决数据损坏问题,但最终不得不将数据转移到一个新的集群中,以便在转移过程中移除损坏的记录。

Yelp 将 Apache Cassandra 作为其平台许多组件的数据存储系统,他们根据数据、流量和业务需求为特定的场景提供了许多较小的 Cassandra 集群。最初,Cassandra 集群直接托管在 EC2 上,但最近,他们通过一个专门的 Operator 将大多数集群转移到 Kubernetes 上。

团队发现,一个在 EC2 上运行的 Cassandra 集群受到了损坏的数据的影响,常规数据维护工具无法解决这个问题。随着时间的推移,情况变得越来越糟,甚至进一步影响集群的运行。

Yelp 软件工程师 Muhammad Junaid Muzammil 解释了选择重建损坏的 Cassandra 集群的原因:

由于数据损坏的情况很普遍,删除 SSTable 并进行修复并不是一种好的选择,因为它会导致数据丢失。此外,根据对损坏数据多少的估计和最近的数据值,我们选择不将集群恢复到上次无损坏的备份状态。

团队选择的设计方案的灵感来自于制造业中使用的分拣系统,这种系统会逐步消除到达生产线末端的缺陷产品。他们使用他们的 PaaStorm 流式处理器和 Cassandra Source 连接器(该连接器基于变更数据捕获(CDC)功能,该功能在 Cassandra 3.8 版本中可用)创建了一个数据管道。

受损数据迁移管道架构视图(来源:https://engineeringblog.yelp.com/2023/01/rebuilding-a-cassandra-cluster-using-yelps-data-pipeline.html)

得益于硬件和软件升级方面的好处,数据基础设施团队在 Kubernetes 上创建了一个新的 Cassandra 集群。数据管道使用 Stream SQL 处理器来定义数据卫生标准,将数据分割为有效的数据流和受损的数据流。管道使用 Cassandra Sink Connector 将经过处理的数据流送入新的 Cassandra 集群。受损的数据流被进一步分析,以便获取数据损坏的严重程度。

团队使用统计抽样技术来验证整个数据迁移过程,通过比较导入到新集群的数据和旧集群中的数据来检查一小部分数据。

在将流量切换到新集群之前,团队通过一个设置将读取请求同时发送到两个集群,并比较返回的数据。他们对记录的结果进行分析,估计旧集群中有 0.009% 的数据损坏。最后,流量被无缝地切换到新集群,损坏的集群被拆除。

读取请求的数据验证(来源:https://engineeringblog.yelp.com/2023/01/rebuilding-a-cassandra-cluster-using-yelps-data-pipeline.html)

原文链接

https://www.infoq.com/news/2023/07/yelp-corrupted-cassandra-rebuild/

声明:本文由 InfoQ 翻译,未经许可禁止转载。

今日好文推荐

吵翻了!到底该选 Rust 还是 Go,成2023年最大技术分歧

我的20年职业生涯:全是技术债

中国最大公有云服务商,如何从零开始构建一支云效团队

工信部要求所有 App、小程序备案;某国产电商被提名 Pwnie Awards “最差厂商奖”;阿里财报超预期 | Q资讯

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
华为宣布昇腾AI集群升级 推出首个万卡AI集群[视听] 黑烬EL3P 桌面有源音响最终解决方案​大叔谈移民,来英国的终极解决方案如何基于Apache Doris构建新一代日志分析平台|解决方案On Taobao, Someone Can Yell at Your Hopeless Romantic FriendeBay的平台自动升级解决方案美国和加拿大华埠领袖齐聚温哥华,探讨共同面临的挑战并寻找解决方案唐三藏与马道婆腾讯云发布多个行业大模型解决方案,提供MaaS服务|最前线【首发】众精医学完成千万级Pre-A轮融资,着力构建中国尿液检测精准医学解决方案从越南停电,看中国的解决方案!成功预测90%错义突变,DeepMind团队开发新AI模型AlphaMissense,有望解决人类遗传疾病的最大挑战EB-5项目失败?无法创造足够就业?无法申请I-829?The Riv 项目也许可以作为解决方案帮助您!扔掉 ELK!来试试我司使用 5 年多的 Nginx 日志解决方案,真香![评测]PowerColor Hellhound AMD Radeon RX 7700 XT 12GB GDDR6 评测父亲与儿子的关系。。。四年、投入20%计算资源,OpenAI成立专门团队构建解决对齐问题的超强AIHebei: Man Held for Defrauding Millions Meant for Sick Children𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶内衣裤,软弹有度,上身0束缚~联想进军Android领域,计划推出Android PCMarketUP:企业直播获客解决方案关于大外宣我想抱梅西---一场精心导演的戏剧瞄准B端!腾讯云推多款行业大模型解决方案,打造模型应用商店The Ultimate College Panel | Get In and Stand Out in Top Schools【𝐂𝐚𝐥𝐧𝐢𝐊𝐞𝐚𝐧双皮奶无痕内裤】49元三条!巨巨巨好穿 !!简直就是辣妹顶配,食品级冰箱收纳盒【一日团】越南电荒、东南亚产业转移、中国解决方案For Young Chinese, 2023 Is the Year of the ‘Drifter’那年花爸的钱, 谈10块的恋爱彭博投资组合分析工具月报 | 结合ESG的投资组合分析;彭博SFDR PAI解决方案法律翻译|新西兰2016年国际学生合同纠纷解决方案——第一部分“争议解决程序”“思考与颠覆,创新与创造”——《混沌企业创新力解决方案》首次发布彭博推出基金数据解决方案扔掉 ELK!来试试这套我司使用 5 年多的 Nginx 日志解决方案,真香!Checkmate HATE: 10th Annual Chess-in-the- Park
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。