生产环境CPU过高问题定位

时间:2021-04-19 17:45:00

问题描述:
       生产环境下的某台tomcat7服务器,在刚发布时的时候一切都很正常,在运行一段时间后就出现CPU占用很高的问题,基本上是负载一天比一天高。

解决过程:

1、根据top命令,发现PID为2633的Java进程占用CPU高达300%,出现故障。
    2、找到该进程后,如何定位具体线程或代码呢,首先显示线程列表,并按照CPU占用高的线程排序:
      [root@localhost logs]# ps -mp 2633 -o THREAD,tid,time | sort -rn

显示结果如下:
       USER     %CPU PRI SCNT WCHAN  USER SYSTEM   TID     TIME
       root     10.5  19    - -         -      -  3626 00:12:48
       root     10.1  19    - -         -      -  3593 00:12:16

3、将需要的线程ID转换为16进制格式

[root@localhost logs]# printf "%x\n" 3626
       e18

4、打印线程的堆栈信息

[root@localhost logs]# jstack 2633 |grep e18 -A 30