Redian新闻
>
FA15# 日志平台演进点梳理

FA15# 日志平台演进点梳理

科技

引言

可观测数据平台需至少整合Logging(日志)、Metrics(指标)、Tracing(链路)三个基本类型数据,并延伸events(事件)、网络流量、用户行为分析、审计、基础的IT设施监控等各类数据的融合。

通过一站式观测平台将各类数据融合呈现,打通数据孤岛,提升排查效率,助力辅助决策。本文只就Logging日志类演进点进行梳理。主要内容有:

  • 架构简图
  • 日志采集
  • 用户体验
  • 功能增强
  • 成本优化
一、架构简图


备注:更多内容详见:

FA6# 全链路观测平台设计点归纳

https://mp.weixin.qq.com/s/Bi2B9G-rSSmz7SRCQJysUA

二、日志采集

日志采集Agent是日志平台的核心部件,该Agent的能力演进也很重要,本小节从采集类型、稳定性监控、降本调优演进点梳理。

1.采集类型

日志采集的延伸极广,可根据不同的维度,粗略打表梳理如下:

分类维度常见类型
服务器类型物理机(或虚机例如:ECS)、容器
应用类型Java、Go、Node.js、Python等不同语言日志
中间件类型RocketMQ、Kafka、ElasticSearch、网关、Redis、Nginx、数据库等
不同端点服务端、移动端
不同文本text、json等

另外,还有不同的物联网设备等,不再罗列。

演进点1:采集代理不断扩大采集的类型以及采集资源的动态调整。

2.稳定性监控

  • 监控点一:文件读取速率
  • 监控点二:代理输出速率
  • 监控点三:CPU使用负载情况
  • 监控点四:内存使用情况
  • 监控点五:采集流量控制
  • 监控点六:资源隔离Agent的资源占用不影响服务
  • 监控点七:采集代理异常日志输出


演进点2:采集代理的稳定性监控、流控及告警。

三、用户体验
  • 基本查询:精确查询、模糊查询、复杂查询(and、or、not等)
  • 查询体验:高亮显示、上下文、导出文件
  • SQL分析:基于查询结果进行SQL分析
  • 函数支持:支持一些函数聚合能力
  • 报表视图:查询结果的视图分布渲染
  • 查询耗时:秒级查询体验、采集分钟级延迟


演进点3:向查询体验、查询响应、SQL分析、函数支持、报表视图等用户体验方向演进

四、功能增强

  • 日志格式:统一日志格式
  • 日志订阅:方便业务个性化处理
  • 日志清洗:日志去重、聚合
  • 运维管理:日志运维后台系统
  • 监控告警:可视化监控与告警配置
  • 成本分摊:日志成本在各个域、各个应用的分摊


演进点4:从功能增强、运维操作、监控告警、成本分摊方面演进。

五、成本优化

存储成本优化

  • ElasticSearch存储:冷热节点架构
  • ClickHouse存储:部分场景使用ClickHouse替换ElasticSearch存储,降低成本

参见:

ClickHouse vs Elasticsearch:谁更胜一筹
https://developer.aliyun.com/article/783804

京东APP秒级百G日志传输存储架构设计与实战
https://mp.weixin.qq.com/s/o4yi-2U9JMCZTHaEAgFrow

基于Clickhouse的下一代日志系统技术揭秘
https://mp.weixin.qq.com/s/d2PbeLesLXKLldr4PgMy_g

采集代理优化

  • 吞吐能力对比
  • 相同吞吐占用CPU、内存资源情况

参见:Filebeat与iLogtail对比测试,后者比前者稳定和省资源

https://github.com/alibaba/ilogtail/blob/main/docs/zh/performance/Performance-compare-with-filebeat.md


演进点5:提高采集吞吐,降低机器成本。





微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
ES09# Filebeat配置项及吞吐调优项梳理我学语文教语文的一生(36)想成为400分之一,高二的学生是时候梳理一下你的荣誉和课外活动了!评分9.1,又丧又治愈的《我的解放日志》:普通人的解放,没有统一路径《我的解放日志》|在这部9.1分的韩剧里,我们都看到了自己疲惫生活的样子何志毅:宋志平的“三精”ES07# Elasticsearch索引指标梳理三月杂记:三张照片的故事。。。一周年特别节目梳理独立纪录片导演之邱炯炯 | 凹凸TOALL第38期六神磊磊:尹志平堕落考身材奋斗日志-减肥瘦身的三个秘密CK03# ClickHouse日志存储设计点梳理宋志平谈管理:企业需要“剪枝”宋志平:渡过难关,我给企业家3个建议Wi-Fi 6落地三年后,Wi-Fi 7「超速」演进BCG科技组织系列五:线上线下融合中的组织演进赴美:赴美手续梳理(6.12起,不在需要行前新冠检测)附赴美清单CK02# ClickHouse分布式表读写原理梳理宋志平:企业家精神是企业最宝贵的财富罗永浩的“执念”:我的梦想是做最大的计算平台,参与或领导一次平台革命给大家梳理下,为互联网「无偿」打工的各种场景当平台经济渗透至临床研究,药企、CRO、SMO能够在平台中得到什么?写工作日志,是公司衰败的前兆。关于你的回忆德州校园枪击案最新进展梳理|费城学区推迟高中晚开学计划|与市政府官员接洽时注意事项哈哈哈哈,我必须把这个说一下k8s01# K8s日志采集与服务质量QoSES06# Filebeat采集原理与监控指标梳理基于互联网架构演进, 构建秒杀系统一文梳理汽车半导体芯片的投资机会智库讲堂 | 宋志平×王石×何志毅:面对日趋复杂多变的竞争环境,企业如何践行“三精管理”?BCG科技组织系列四:软硬融合下的组织演进CK01# ClickHouse术语及知识点梳理【宏观经济】工业用地抵押转让:约束条件全梳理溜肝尖
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。