Redian新闻
>
点一下详情系统挂了,CPU100%

点一下详情系统挂了,CPU100%

公众号新闻

又是一个百无聊赖的早晨,我在快乐地摸鱼,工作群响了:离线系统登录不上了。我第一反应是不科学啊,系统已经很久改动过了...赶紧上生产环境看看,CPU高达1200%。接着又是熟练地敲出那几行排查CPU过高的命令

top -H -p  pid查看java占用率最高的几条线程
jstack pid >  xxx.txt   打印线程快照
jmap -heap pid   查看堆内存情况

看这玩意啥都看不出来,感觉是系统对象没有释放,在疯狂GC,但是因为FULL GC的时候已经STW了,所以无法查看到底是哪个线程出了问题。然后过了10分钟系统突然又好了....堵塞的操作已经完成,gc能正常回收了。

然后过了两分钟又卡死了,我先重启了系统,后面再分析分析。

等系统没什么人用的时候,我再试着重现一下问题,打开系统一顿乱点,结果是点开某个功能的详情时系统卡住了,CPU又飚上去了,喜闻乐见~问题定位到了,再实锤一下之前是不是这个问题,我看了一下localhost_access_log日志发现,确实是这个接口卡了一千多秒。

因为离线没什么人使用,所以问题过了很久再暴露出来。看了一下代码,主要是同事业务逻辑问题,有个参数没传进去,导致 sql 走了全表扫描,数据很多,要查很久,查到了几百万的数据,gc 也无法回收。

还好内存够大,要不然早就 OOM 了。

复盘

一开始我以为是某个接口调了很多次并发太高导致的,没想到点一下详情系统就挂了。。我们可以看到CPU在GC回收的时候STW,是没有线程能占用到CPU的,所以top -H -p pid 只能看到CPU全被GC线程占用了。如果是某个接口并发太高导致的,我们可以看jstack线程快照,里面是会有这个接口在执行的记录。

还有一个问题就是说系统GC卡了10-20分钟,却没有报OOM,还是一直在堵塞状态,后面还正常了一小会,这个是需要看堆内存的情况...

因为比较难排查所以只是通过现象知道GC还是可以回收一点点垃圾的

总结

1、CPU100%的时候可以打印线程快照jstack pid,查看是哪个线程占用了CPU,一般都是某个业务线程阻塞无法进行GC回收导致。

2、可以查看localhost_access_log查看系统接口用时,一般用时很久的都是有问题的接口。

3、同事的业务代码参数没有传,导致全表扫描直接卡死系统。

来源:juejin.cn/post/7233307834456129593


推荐

1. 优秀的 Java 代码都是如何分层的 ?看了直呼NB!

2. IDEA新UI速览,成了 VS Code 的样子?

3. 如果有一千万数据,怎么用Java快速查询?

4. 废物利用,拿自己的旧电脑搭建个服务器吧!



最近面试BAT,整理一份面试资料Java面试BATJ通关手册,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。
获取方式:点“在看”,关注公众号并回复 Java 领取,更多内容陆续奉上。
PS:因公众号平台更改了推送规则,如果不想错过内容,记得读完点一下在看,加个星标,这样每次新文章推送才会第一时间出现在你的订阅列里。
“在看”支持呀,谢谢啦

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
信创之CPU、GPU、存储、整机基础硬件我去,Linux 系统 CPU 100% 打满了!《薔薇處處開》预测超长蛋白质这事,CPU赢了QM报告:手游回暖,星铁日均DAU900万,逆水寒公测DAU1100万为了你走遍草原 第八章创新高!加拿大房租狂飚至$3000/月,留学生:再次被房租CPU…《东风第一枝 - 谷雨》最高32核CPU、80核GPU,苹果M3 Ultra芯片规格曝光“我在资本市场,点一下鼠标就几千万!”“股神”贪官腐败细节披露:违规动用2.2亿财政资金炒股,曾赢得“不爱钱”的名声…i5-9400f CPU with asus b365m bundle(cpu good mb faulty)400000000000000000倍!这是真正的天文数字→23/24冬季学期第七波录取|13封来自TU9、U15大学的录取好消息!开挂了!奥莱月末疯狂大促,真是开挂了!安德UA玛,Burberry,CK史前疯折开打一文搞懂GPU的概念、工作原理,以及与CPU的区别《花信风之谷雨》商汤、清华通才AI智能体,100%解锁我的世界!单CPU训2天,白手起家打造红石电路寄了,线上服务挂了 3 分钟!世界首颗AI全自动设计CPU!中国团队重磅推出,性能堪比486,规模提升4000倍一位北大才子的"润"之路DPU与智能网卡技术公开课上新!三位技术大牛主讲开源DPU、内生安全智能网卡与DPU云化裸金属三句话生成CPU!中科院ChipGPT攻克AI芯片设计?代码量减少近10倍AMD MI300C 纯 CPU AI 加速器曝光:96 个 Zen4 核心、128GB HBM3顶流cp也be了?cp粉的命不是命……面试经历 | 面试挂了,Meta HR居然主动打电话加面!Arm新一代架构发布:CPU能效提升40%,GPU性能提升15%基于AI和NPU的Codec变革——VPU与NPU的协同创新小米14系列或配潜望镜头,CPU主频达3.7GHz?校招提前批挂了,会影响秋招吗?迄今最强! deepin 操作系统适配阿里 RISC-V CPU学员OFFER | 面试挂了,Meta HR居然主动打电话加面!GPU垄断AI让人担忧,是时候让CPU发扬光大工信部:加强CPU、GPU和服务器等重点产品研发,增强算力产业自主创新能力巨头ChatGPT大战陷败局,竟因嫌GPU太贵!Meta用CPU跑AI,点错科技树久违了!时隔近8年,9100亿巨头再次涨停!五大上市险企净利飙升近七成,来看详情
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。