Redian新闻
>
如何快速构建Prometheus监控体系,架构、指标、数据、告警… | 极客时间

如何快速构建Prometheus监控体系,架构、指标、数据、告警… | 极客时间

公众号新闻

Prometheus 发展到今天,已经全面接管了 K8s 上的监控体系,形成了一套以它为核心的统一方案,但监控依然是云原生领域非常让人头疼的问题之一。


一方面是因为监控非常重要,直接关系到应用的高效、平稳运行;

另一方面,云原生使监控更加复杂了,除了业务方面,集群、节点、Service、Pod 等等维度众多,并且还要应对短时间内不断变化的现实,同时还面临降低资源开销的挑战。

告警来说,现实困境包括:

  • 没有告警:系统装箱过度,导致节点 CPU 100%,业务已崩而调度器还在不停调度Pod;

  • 海量告警=没有告警:一天 200 个告警电话,处理一个告警的时候同时又收到10个告警;

  • 可自愈的告警不该告警:周末背着电脑和朋友聚餐,接到告警电话立马处理,登录系统后发现已经自动恢复,关上电脑结果又出现告警…

在具体的监控指标规划上,业界通用的两个原则是 USE 和 RED 。

监控指标来看,如节点和容器的资源使用情况等等,需要考虑利用率(Utilization),资源被有效利用起来提供服务的平均时间占比;饱和度(Saturation),资源拥挤的程度,比如工作队列的长度;错误率(Errors),错误的数量。

服务监控指标来看,比如 kube-apiserver 或者某个应用的工作情况,要考虑每秒请求数量(Rate)、每秒错误数量(Errors)、服务响应时间(Duration)。

怎么样,是不是感觉实现起来复杂度挺高的?

今天给你推荐一个监控方面的优质专题,Prometheus 监控体系构建:架构设计与告警实现,腾讯技术专家孟凡杰的分享,原理+实操,帮你扫清监控方面的障碍,掌握可复制的解决方案。

公号粉丝0元领👇

添加后

获取免费报名链接和配套课件哦~

📢本专题不适合学生群体

如有相关编程经验可酌情考虑

公号粉丝加赠:云原生领域经典电子书及Prometheus拓展学习文档,可别错过了!

2节视频课,8大内容要点,包括以 Prometheus 为核心的监控系统的架构设计以及如何实现有效告警。在建立对监控体系的整体认知基础上进一步实操,对企业级的应用做到心中有数。

如果你存在以下困惑都建议你来学习一下:

  • 对 Prometheus 上手难有怨言

  • 对通过修改配置文件来管理 Prometheus 的方式有痛点

  • 对因为数据量过大而无法扩展您的 Prometheus 感到有困扰

  • 在生产环境运行多套 Prometheus 集群面临管理和使用上的不便

  • 在企业数字化转型过程中对于如何架构适合您的云原生监控方案有困惑

添加后

获取免费报名链接和配套课件哦~

📢本专题不适合学生群体

如有相关编程经验可酌情考虑

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
韩梨泰院惨案后续太诡异!负责警察“畏罪自杀”,被指销毁证据、故意延迟出警……Wu Zetian and the Quest for Feminism in All the Wrong Places不要写suggest somebody to do something如果重新设计一款数据库,架构会是什么样子?Out with the old, in with the new. JuniorCoach is here for youCLUE社区最新神器!PromptCLUE:大规模多任务Prompt预训练中文开源模型Prompt总结 | 从MLM预训任务到Prompt Learning原理解析与Zero-shot分类、NER简单实践PromptCLUE:大规模多任务Prompt预训练中文开源模型For China’s Students, the COVID Wave Comes at the Cruelest Time回锅肉与白菜炒虾之婚姻百态今天是九月九5 个 htop 替代:增强你的 Linux 系统监控体验 | Linux 中国GlobalWoZ: 面向全球通用的人机对话系统——快速构建多语对话能力初探倒计时1天,如何快速锁定AI前沿讯息|MEET大会指南主流监控系统 Prometheus 学习指南【万歌诗词】卷五、诗评数智底座必备能力三:快速构建创新应用 | Q推荐SpringBoot + Prometheus + Grafana 打造可视化监控一条龙!前P10毕玄:聊聊我眼中的阿里 14 年架构演进 | 极客时间如何在面试中巧妙展现架构能力?附200道面试真题+100例经典架构案例拆解 | 极客时间Prometheus API 使用介绍用Prometheus监控K8s,从核心原理到告警实操都讲明白了 | 极客时间过去百年最值得尊敬的老太太,离开这个世界了Rust:香是真的香,不同学习者却各有各的难​ | 极客时间10分钟快速构建一套自己的虚拟开发环境,Vagrant 堪称效率神器!SpringBoot+Prometheus+Grafana 实现自定义监控Another ‘Three-Body’ Animation Wins Praise From Sci-Fi Fans前阿里巴巴 P9 实践总结:如何画好架构图?| 极客时间Recommend somebody to do something是错误说法吗?The Chinese Online Slang That Took Over the Internet in 2022Prometheus Metric 的实践总结,搞定监控需注意~不写代码,就能快速构建精准的机器学习模型一个人的徒步,900公里法国之路+世界尽头:D48~Feeling Spain天数智芯发布通用GPU推理产品智铠100,训推一体加速构建AI自主生态【明日截单】埃及风机娘HEMET NETHEL,粘土人锦木千束最后预定!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。