Redian新闻
>
关于 RabbitMQ,多么希望当初有人告诉我们这些

关于 RabbitMQ,多么希望当初有人告诉我们这些

公众号新闻

作者 | Ryan Rodemoyer
译者 | 明知山
策划 | Tina

我的手表嗡嗡作响,在黎明前的昏沉中,我不知道这是闹钟响了还是来电话了。现在是凌晨 4 点 45 分。我回过神来,才意识到这是一个陌生号码来电——这可不是什么好兆头。我接通电话,是我的一个同事——他负责我们的支持团队,为我们的客户处理所有的生产问题。“Ryan,抱歉吵醒你,现在还很早。我们最大的客户报告说,他们发出的请求需要两个多小时才能返回结果。我们认为是我们的信息系统出问题了,但我们不确定接下来该怎么做。我们需要你的帮助。请加入我们的电话会议。”过了一会儿,我的手表又响了,这次是闹钟。今天早上的早起可不是为了锻炼。

我们已经在生产环境中运行 RabbitMQ 将近三年了,99.5% 的时间都没有问题。在此期间,我们扩展到了 200 多个运行在数十个虚拟机上的并发消费者客户端,并处理来自我们.NET 应用程序的数亿条消息。我们的主要业务场景是通过 HTTP 调用 Web 服务,获取 JSON 数据或下载 PDF 文档。我会推荐使用 RabbitMQ,因为我们就用了。在大多数情况下,它都很棒,在我们的系统中表现良好。但这里有一个很大的问题,我们在做架构决策时并不知道。

我们使用 RabbitMQ 来轮询调度作业的执行结果。一般的操作顺序是这样的:用户通过 Web 应用程序提交请求,后端在处理请求时向 RabbitMQ 中添加消息,消费者客户端获取消息并通过 HTTP 调用另一个 Web 服务,将请求提交给实际处理业务逻辑的服务。然后,轮询逻辑开始接管,队列中的后续消息用于轮询处理结果。如果作业还没有执行结果,消费者将消息放回队列,等待下一次轮询尝试(等待时间可由客户配置)。等待的延迟逻辑使用了存活时间(Time-To-Live,TTL)和死信队列。

我们的非生产集群使用两个或三个节点,生产集群使用三个节点。每个集群都有一个负载均衡器,应用程序的流量严格流经负载均衡器。在运行时,发布者和消费者使用相同的负载均衡器。

1 你应该知道的

在使用 RabbitMQ 三年后,如果再要写与 RabbitMQ 交互相关的代码,我一定会这样告诉我自己。

2 一开始就请专家帮忙

你可以大概花 2000 到 3000 美元从 RabbitMQ 咨询公司找来专家,利用这个机会审查和验证你的假设和计划、提出问题、获取建议并进行尽职调查,这样就可以减少可能在未来出现的问题。从长远来看,现在做出正确的决策,最有可能在未来帮你节约成本。或者你也可以像我们一样,在遇到麻烦时找专家帮忙。

3 我们使用了 EasyNetQ 或 NServiceBus

我们的应用程序使用了 RabbitMQ.Client 库,一些抽象库(如 EasyNetQ 和 NServiceBus)也使用了它。这些抽象库比我更了解 RabbitMQ 的底层交互。RabbitMQ 的驱动程序相对底层,所以你需要了解 RabbitMQ 的底层细节。如果这是你第一次使用 RabbitMQ,我保证你不会对它有任何溢美之词。

如果你想知道“为什么不使用包装器库”,我可以告诉你,最初的开发人员在实现接近尾声时离开了公司,他已经使用了 RabbitMQ.Client ,而这个项目最后落到了我的手上。我没有足够的时间重构(我也没想到要把它换成包装器库)。

4 网络分区是个大问题

RabbitMQ 一般被部署成集群,集群由一个或多个节点组成,节点是运行 RabbitMQ 实例的服务器或容器。集群中所有的节点都必须运行完全相同版本的 RabbitMQ。

RabbitMQ 提供了一种叫作聚簇(Clustering)的机制,这样你就可以将多个 RabbitMQ 实例链接起来,成为一个逻辑 Broker。你可以将请求发送给集群中的任意一个节点,节点会合作发布消息或将消息发送给消费者。

节点之间通过交换关于消息、队列等的信息不断相互通信。如果通信中断,即使只是几毫秒,RabbitMQ 也会进入分区状态,然后它们会根据配置文件中配置的内容决定如何处理通信中断。默认的处理策略是 ignore,也就是直接进入分区状态,并在这种“脑裂”模式下继续运行,从而使集群陷入完全的混乱。这对我们来说简直就是地狱(对我来说更是如此)。退出分区状态的唯一方法是重启分区一侧的节点,然后重新连接另一侧,并丢弃从集群发生分区时积累的数据。

我经历过两种方式的网络分区:通过 Windows 更新和防火墙规则同时更新集群中所有的节点。

对于这个话题,我可以无休止地咆哮,所以我不得不让自己消停一下。正确的配置应该是将 partition_handling 策略设置为 pause_minority。当集群发生分区时,分区的一侧应该将自己关闭,避免发生脑裂。被关闭的一方继续监控集群,等待恢复通信,并在恢复时重新加入。现在你所要做的就是确保你的代码能够正确地处理断开的连接,这样你就有了一个相当健壮的队列解决方案。

根据 CAP 定理,ignore 策略意味着牺牲一致性换取可用性,而 pause_minority 意味着牺牲可用性换取一致性。如果你问我的话,我认为后者是值得的。

5 你打算如何升级 RabbitMQ

你的 RabbitMQ 版本总归会有过时的那一天。到时候你会怎么做?继续使用不受支持的版本?创建一个新的集群?你计划怎样将流量从遗留集群迁移到新集群?之前已经提到,集群中的所有节点都应该是相同的版本。如果你的计划是进行就地升级,你就会知道这将是多么棘手。

我留给你的只有问题,没有答案。因为每一个决策都高度依赖具体的组织和运营策略。换句话说,每个人可能都有不同的方法来解决这些问题。

6 如果 RabbitMQ 的消息全部丢失,你该怎么办

如果 RabbitMQ 中所有(或者三分之一)的消息丢失了,你会有多惨?RabbitMQ 是你用来保存记录的系统吗?你有让应用程序回到正常状态的恢复策略吗?如果你把本地服务器迁移到云端,如何让你的 RabbitMQ 消息再次流动起来?

7 让发布者和消费者使用不同的连接地址

在未来的某个时刻(可能是在升级期间),你希望能够灵活地向不同的集群或负载均衡器发布消息或读取消息。这是一种零风险高回报的模式,你可以尽早在应用程序中使用这种模式,未来的你会因此感谢现在的你。

8 不断增长的日志文件将占用几十 GB 的磁盘空间

随着时间的推移,RabbitMQ 的日志文件会增长到占用几十 GB 的磁盘空间。我们可以使用 rabbitmqctl rotate_logs 来滚动这些文件,不过也要努力使这个过程自动化,避免因“磁盘空间不足”导致停机。

9 结论

RabbitMQ 是我们基础设施的一个稳固的组件,选择它可能是一个正确的决定。但你也应该认真对待我在本文中提出的那些问题,至少应该与你的同事和利益相关者沟通,看看应该试着解决哪些痛点。

原文链接:

https://ryanrodemoyer.github.io/what-i-wish-someone-would-have-told-me-about-using-rabbitmq-before-it-was-too-late/

声明:本文为InfoQ翻译,未经许可禁止转载。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

智联招聘:Q3 全国平均招聘月薪 10168 元;曝特斯拉拒招小鹏前员工;英特尔或裁员数千人,国内公司涉多起劳动纠纷|Q 资讯

专访“MySQL 之父”:我曾创造 MySQL,也将颠覆 MySQL

另一种“推翻” VS Code 的尝试:JetBrains Fleet 现开放公测

社区分裂、应用争议,5年都没火起来的WebAssembly “炒错”方向了?

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
消息队列原理和选型:Kafka、RocketMQ 、RabbitMQ 和 ActiveMQ过来人告诉你,如何一眼识别烂户型这是你应该让孩子知道的最重要的事(小时候没人告诉过我)100幅漫画告诉我们:教育可以很简单!关于存钱赚钱这件事,这些道理怎么没有人早点告诉我​从《查尔斯三世》到《李尔王》:那些戏剧告诉我们的王权更迭宁可少活二十年拼命拿下大油田IKEA x OBEGRÄNSAD联名!宜家22年最受瞩目系列开售!今日聚焦:历史告诉我们:除了强大,我们别无出路!成都医生:层层加码,多么让人绝望刘擎:流行文化告诉我们,人就不应该相信爱情天蓝和玫红“感情破裂后,该不该离婚?”过来人告诉你关于婚姻的真相2021年越南疫情冲击的市场反应经验告诉我们什么?【教育】这本书告诉我们,华人家庭教育是骗局只有美还不够,王菲与王家卫再度联袂,想要告诉我们什么?古人类DNA与重症新冠有关?2022诺奖得主Pääbo,竟是前诺奖得主私生子钙离子通道(Calcium Channel)与心脏病有些事你不教给孩子,一辈子都不会有人告诉他看看排名前十的高薪工作有哪些历史告诉我们,要苟住川普养出的总统对手 德桑提斯成共和党新楷模!民主党连赢2席 保住参院!梅兰妮亚御用律师 穆沙有望当斯洛文尼亚女总统银行理财报告发布,告诉我们重要信息新毒株XBB,免疫逃逸远超Omicron BA.5!丨谢晓亮团队的最新研究告诉我们要怎么做?李易峰嫖娼事件告诉我们,做坏事要趁早买房风波(3)过来人告诉你,陪你到老的男人,一般身上都有这两个特征在体制内渴望当大官,在大厂又不想太累,你怎么就这么贱?“我们的祖先到底是谁?为何智人胜出?”丨2022诺奖深入回答了这些问题。附Svante Pääbo趣闻这些好评率超高的公众号,别告诉我你一个都没关注金庸告诉我们的:为什么你总和你上司解释不清?我一度觉得,自己的人生没什么希望了平价买到高级感!IKEA全新 OBEGRÄNSAD系列,全系列都好看!美警开枪把人打趴后满口兄弟我来帮你,这一点告诉我们什么坚持高标准的意义,她早已告诉我们
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。