Redian新闻
>
降本增效:Grab 如何在亚马逊云科技上将 Kafka 消费者流量成本降到零

降本增效:Grab 如何在亚马逊云科技上将 Kafka 消费者流量成本降到零

公众号新闻

作者 | Rafal Gancarz
译者 | 平川
策划 | 丁晓昀

Kafka 2.3 引入了将 Apache Kafka 消费者连接到相同可用区域(AZ)代理节点的能力,Grab 利用这一能力重新配置了消费者,将亚马逊云科技上的流量成本降低为零。这一更改大大降低了在亚马逊云科技上运行 Apache Kafka 的基础设施总成本。

Grab 以 Apache Kafka 为中心创建了一个流数据平台,支撑公司所有的产品。遵循 Kafka 最佳实践,他们的初始配置为每个 Kafka 分区三个副本,横跨亚马逊云科技区域中三个不同的可用区。负责该平台的团队观察到,跨 AZ 流量占了他们 Kafka 平台一半的成本,因为亚马逊云科技对跨 AZ 数据传输收费。

对于初始设置的成本,Fabrice Harbulot 和 Quang Minh Tran 的看法如下:

这种设计的问题在于,它会产生惊人的跨 AZ 网络流量。这是因为,在默认情况下,Kafka 客户端只与分区 leader 通信,而分区 leader 有 67% 的概率驻留在不同的 AZ 中。

跨 AZ 流量包括新发布的消息、代理之间的数据复制和消费者获取的消息。

默认消费者配置,消费者从分区 leader 获取数据(图片来源:Grab 工程博客)

从 Apache Kafka 2.3 开始,可以将消费者配置为从分区副本中获取数据了。这样,如果消费者只从同一 AZ 中的代理获取消息,就不会产生数据传输成本了。

这个特性要求 Kafka 代理和消费者都知道其所在的 AZ。对于 Kafka 代理,团队会使用 AZ ID(az1、az2、az3 等)配置 broker.rack 。AZ ID 与 AZ 名称(1a、1b、1c 等)不同,因为 AZ 名称在亚马逊云科技账户间不一致。他们还将参数 replica.selector.class 的值设置为 org.apache.kafka.common.replica.RackAwareReplicaSelector。

在消费者端,团队更新了内部 Kafka SDK,基于 EC2 主机元数据用 AZ ID 配置 client.rack 参数,为的是应用程序团队可以通过导出环境变量来启用该功能。

自定义消费者配置,消费者从最近的副本获取数据(图片来源:Grab 工程博客)

在某些服务上应用新设置后,团队观察发现,跨 AZ 流量成本下降,并且有一些值得注意的副作用。首先,端到端延迟最多增加了 500 毫秒。考虑到大多数消费者从副本获取消息,这也是意料之中的。延迟增加是由复制时间导致的。理论上,任何对延迟敏感的数据流都应该始终从分区 leader 获取数据,即使那样会产生额外的成本。

其次,在代理维护(停机)时,直接从副本获取消息的消费者可能会遇到代理不可用的情况,因此,它们应该等待 / 重试,直到同一 AZ 中的代理恢复在线。最后,团队观察到,代理的负载与跨 AZ 的消费者数量有关。这意味着,消费者的均匀分布对于确保代理的负载平衡至关重要。

原文链接:

https://www.infoq.com/news/2023/07/grab-apache-kafka-aws-cost/


 活动推荐

大模型的出现从根本上改变了数字化转型的赛道,在 InfoQ《超级连麦. 数智大脑》直播中,富滇银行数字金融中心副主任李涛深入探讨了自身对于 AIGC 在金融领域创新方面的思考,分享了银行数字化发展的历程及背后的架构演进。识别下方二维码或关注「InfoQ 数字化经纬」公众号,即可阅读全文。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
以安全为支点,看亚马逊云科技如何撬动数据价值医药申报数量增长、投资紧缩,数字化解决方案如何助力临床研究降本增效?字节2022年财报曝光!营收6220亿利润200亿美元,“降本增效”策略,已取得成效亚马逊云科技中国换帅制造业转型进入深水区怎么做?亚马逊云科技与合作伙伴要做好“最后三公里”恶搞小哥再整活,把亚马逊司机的尿,放在亚马逊,还刷成销量第一?!啊?2023回国--路途中住的酒店,逛的海滩小分子CDMO服务商金凯生科成功上市 助力制药企业降本增效Grab 将 AWS 上 Kafka 消费者的流量成本降低为零降本增效:Grab 如何在云上将 Kafka 消费者流量成本降到零从「生成式AI」转化为「生产力」,亚马逊云科技划出重点诺禾致源2023年半年报点评:降本增效成果显著,海外业务有望持续高增长【东吴医药朱国广团队】机器人降本增效福音!AMD甩出系统模块利器,大降能耗成本,新手也能速成亚马逊云科技大中华区换帅,原百度副总裁接任从开源模型到商业落地应用,亚马逊云科技构建实用路线图!降本增效,企业能做什么?|GGV OMEGA Workshop2023 广州印象 (1,2,3)现金为王 零售业全部降本增效 扩张最危险EMQ & 亚马逊云科技联合主题沙龙:新经济周期下企业出海的数字化引擎亿咖通·安托拉系列计算平台,降本增效「典范」|年度好产品入围公示当我们在说“降本增效”的时候,指的到底是哪一种“本”,哪一种“效”?全球云享狂欢,尊享特惠盛宴,亚马逊云科技双11也开始推活动了为生成式AI铺路筑基 亚马逊云科技用了哪些招儿?一条可以吃的街我在主席台落座亚马逊云科技将对公共 IPv4 地址收费不只降本增效!文生图以后,AI正在帮助净化游戏环境中国出海主力系列专访之比亚迪:长期深耕助力中国新能源飘洋过海 携手亚马逊云科技共赢海外华讯网络与亚马逊云科技双向奔赴,云上安全责任共担是时候基于云重新设计 Kafka 了!AutoMQ 如何实现 Kafka 十倍的降本增效降本增效模范生——摩根大通想降本增效,先用好业务流程Agent:OpenAI的下一步,亚马逊云科技站在第5层AIGC日报丨曝OpenAI拟自研AI芯片,计划收购公司;亚马逊云科技全托管生成式AI服务Amazon Bedrock正式可用
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。