- 一次 k3s 容器无法访问外网分析
问题现象k3s 边缘集群容器无法与外网建连,现象是发出去的 SYN 包没有收到回复 SYN+ACK 的包,但在物理机上一切正常,ping 和 curl 都可以成功。经确认,实际上不止这个域名无法建连,其实是容器压根无法访问外网,ping 和 tcp 建连都是不行的,ping 显示 100% loss
- 一次 Dubbo 线程上下文类加载器的疑难杂症分析
问题环境dubbo:2.7.18java:java8问题背景有业务(Java)的同学反馈,在接入了 devops 的某些 javaagent 以后会极大概率出现 dubbo 调用失败,dubbo 接口中用到的业务类都提示找不到,导致反序列化失败,部分日志输出如下:[2023-02-09 19:22:
- 一次有趣的 DNS 导致 Node 服务故障问题分析实录
问题描述有一个部署 k3s 的边缘节点的机器,切到离线模式以后,有一个前端页面的部分请求接口异常了。node 部分的请求分为两类,一种是纯 node 的处理,一种是需要先 http 请求后端微服务的处理接口。现象是涉及 Node 请求后端 Java 服务的都 block 住了,纯 node 处理的请
- 如何修改 Nginx 源码实现 worker 进程隔离
背景最近我们线上网关替换为了 APISIX,也遇到了一些问题,有一个比较难解决的问题是 APISIX 的进程隔离问题。APISIX 不同种类请求的互相影响首先我们遇到的就是 APISIX Prometheus 插件在监控数据过多时影响正常业务接口响应的问题。当启用 Prometheus 插件以后,可
- 一些可以显著提高 Java 启动速度方法
我们线上的业务 jar 包基本上普遍比较庞大,动不动一个 jar 包上百 M,启动时间在分钟级,拖慢了我们在故障时快速扩容的响应。于是做了一些分析,看看 Java 程序启动慢到底慢在哪里,如何去优化,目前的效果是大部分大型应用启动时间可以缩短 30%~50%主要有下面这些内容修改 async-pr
- 一次 Kafka 导致的 Sentry 无法处理 MiniDump 问题分析
业务反馈部署的 Sentry 系统处理 Electron 的 MiniDump 信息出现异常,界面提示。于是做了一次分析,记录如下。Sentry 是什么Sentry 是一个跨平台的应用错误跟踪系统,专注于错误报告,支持 web 前后端、移动应用以及游戏,此次反馈问题的是 Windows PC 端
- 记一次 Netty PR 的提交
有一个热心网友丁师傅提了一个问题,问为什么 netty 源码中,有这样一段代码public final class InternalThreadLocalMap extends UnpaddedInternalThreadLocalMap { // ArrayList-related