Redian新闻
>
Grab 将 AWS 上 Kafka 消费者的流量成本降低为零

Grab 将 AWS 上 Kafka 消费者的流量成本降低为零

公众号新闻

作者 | Rafal Gancarz
译者 | 平川
策划 | 丁晓昀

Kafka 2.3 引入了将 Apache Kafka 消费者连接到相同可用区域(AZ)代理节点的能力,Grab 利用这一能力重新配置了消费者,将 AWS 上的流量成本降低为零。这一更改大大降低了在 AWS 上运行 Apache Kafka 的基础设施总成本。

Grab 以 Apache Kafka 为中心创建了一个流数据平台,支撑公司所有的产品。遵循 Kafka 最佳实践,他们的初始配置为每个 Kafka 分区三个副本,横跨 AWS 区域中三个不同的可用区。负责该平台的团队观察到,跨 AZ 流量占了他们 Kafka 平台一半的成本,因为 AWS 对跨 AZ 数据传输收费。

对于初始设置的成本,Fabrice Harbulot 和 Quang Minh Tran 的看法如下:

这种设计的问题在于,它会产生惊人的跨 AZ 网络流量。这是因为,在默认情况下,Kafka 客户端只与分区 leader 通信,而分区 leader 有 67% 的概率驻留在不同的 AZ 中。

跨 AZ 流量包括新发布的消息、代理之间的数据复制和消费者获取的消息。

默认消费者配置,消费者从分区 leader 获取数据(图片来源:Grab 工程博客)

从 Apache Kafka 2.3 开始,可以将消费者配置为从分区副本中获取数据了。这样,如果消费者只从同一 AZ 中的代理获取消息,就不会产生数据传输成本了。

这个特性要求 Kafka 代理和消费者都知道其所在的 AZ。对于 Kafka 代理,团队会使用 AZ ID(az1、az2、az3 等)配置 broker.rack 。AZ ID 与 AZ 名称(1a、1b、1c 等)不同,因为 AZ 名称在 AWS 账户间不一致。他们还将参数 replica.selector.class 的值设置为 org.apache.kafka.common.replica.RackAwareReplicaSelector。

在消费者端,团队更新了内部 Kafka SDK,基于 EC2 主机元数据用 AZ ID 配置 client.rack 参数,为的是应用程序团队可以通过导出环境变量来启用该功能。

自定义消费者配置,消费者从最近的副本获取数据(图片来源:Grab 工程博客)

在某些服务上应用新设置后,团队观察发现,跨 AZ 流量成本下降,并且有一些值得注意的副作用。首先,端到端延迟最多增加了 500 毫秒。考虑到大多数消费者从副本获取消息,这也是意料之中的。延迟增加是由复制时间导致的。理论上,任何对延迟敏感的数据流都应该始终从分区 leader 获取数据,即使那样会产生额外的成本。

其次,在代理维护(停机)时,直接从副本获取消息的消费者可能会遇到代理不可用的情况,因此,它们应该等待 / 重试,直到同一 AZ 中的代理恢复在线。最后,团队观察到,代理的负载与跨 AZ 的消费者数量有关。这意味着,消费者的均匀分布对于确保代理的负载平衡至关重要。

原文链接:

https://www.infoq.com/news/2023/07/grab-apache-kafka-aws-cost/

声明:本文为 InfoQ 翻译,未经许可禁止转载。

今日好文推荐

都在追“新潮”技术,但你有大厂们的动作快吗?

大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型

一场 AI 引发的开源革命迫在眉睫?Hugging Face 更改文本推理软件许可证,不再“开源”

“Twitter如今就像疯人院!”睡地板仍被裁女高管爆料:马斯克带来“恐惧文化”,被裁是最大解脱

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
无需额外插入心脏起搏导管,法国这家公司将PCI手术成本降低12%超越ToT,苏黎世理工发布新一代思维图GoT:推理质量提升62%,成本降低31%韩国名菜人参鸡汤和土产高丽参Apache Doris冷热分层技术如何实现存储成本降低70%?Z世代下,8种真实消费者的样子|附秘籍体验为王!要抓住消费者的心,这个岗位是关键消费者重返餐厅,食品外送应用Grab和Foodpanda将扩展堂食服务李佳琦不当言论伤了消费者的心丨英文报道游戏行业上半年“踩踏式上新”:买量成本上升、头部失速娄岩一周诗词三首中国消费者的代际变迁洞察报告获批量成倍增长!2023上半年香港优才获批数据分析前瞻2035 | 聚焦中国消费者的身心健康:大健康和疗愈悦己经济一亩财经 | 美国消费者信心大增;特斯拉赢得充电战争;Walgreens股票大跌....新泽西养老院记事成本降低一半,百度自动驾驶离我们还远吗薅羊毛!亚马逊大量成人儿童读物、经典文学名著、中式食谱等电子书全场免费!2023夏游江南(下)Llama2等30+模型接入千帆大模型平台,推理成本降50%!还有超全Prompt模板开放体验江南春:传播的本质是重复,消费者的本质是遗忘加拿大这座大城市空气质量成全球最差:喉咙灼烧出门要戴N95!马斯克spaceX,今年第38次发射火箭!2代星链卫星,成本降到1代的6分之一!大模型训练成本降低近一半!新加坡国立大学最新优化器已投入使用弃用 MySQL 后存储成本降低 85%,携程业务系统数据库升级技术实践消费者的指名购买是心智预售的结果阿维塔卷不进消费者的“情感涡流”Pick你心中最好的“可持续消费案例” ,来一场品牌和消费者的“双向奔赴”降本增效:Grab 如何在云上将 Kafka 消费者流量成本降到零直接面向消费者的金融科技企业陷入融资低谷华人小心!举报纽约餐馆和酒吧赚大钱!“最低为8,000美元,最高为33,000美元,这可是一大笔钱!”茅台,你是懂消费者的!将数字孪生成本降至1/100,这家公司用AI逆势生长充电10分钟跑1200公里,丰田官宣重大突破,还要将电池体积重量成本减半!中科大刚刚也有大消息人工智能为何延承人的思维缺陷?降本增效:Grab 如何在亚马逊云科技上将 Kafka 消费者流量成本降到零
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。