项目环境稳定性指标建设之路
引言
技术实践
文章架构
现状
1. 流程梳理
2. 任务特点
任务间有顺序
单个任务为异步进行
3. 任务处理现状
3.1 任务猝死
3.2 任务处理单机瓶颈
3.3 任务重复执行
优化之路
1. 任务猝死优化
1.1 架构升级-领域模型(DDD)
触发流程创建的 GroupEnv(项目环境) 实体
流程操作的 AppRunningEnv(应用环境) 实体
保存流程信息的 Operation 实体
推动流程运行的 TaskEngine(流程引擎) 实体
1.2 流程引擎重构
1.2.1 执行器统一接口
(1)执行操作
1.2.2 使用工厂方法分拆执行器
1.2.3 异常处理兜底
1.2.4 操作子任务状态统一透出
1.2.5 单元测试补齐
1.3 优化结果
2. 任务执行时间优化
分布式分片任务解决单机计算瓶颈
取任务全集
任务分片
多机并行执行
3. 重复执行优化
3.1 秒级调度解决重复执行
4. 多机忙等问题解决
4.1 分布式锁解决多机忙等
结果
环境创建成功率
环境创建时间
任务执行异常率
单次任务执行时间
往期推荐
云上业务稳定性保障实践白皮书
随着客户云上业务规模越来越大,迭代速度越来越快,系统复杂度越来越高,如何保障云上业务稳定性这个话题也变的愈发重要。本文将从理论概念出发、围绕故障管理体系和变更管控体系展开,并根据各行业客户稳定性实践经验,对云上业务稳定性体系建设进行多角度的讲解。
点击阅读原文查看详情。
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章