More  

收藏本站

電腦請使用 Ctrl + D 加入最愛
手機請使用 收藏
關閉

小編的世界 優質文選 主機

線上服務器cpu 100%了,該如何排查問題?


字體大小:
2021年6月17日 -
:   
 

碼農架構

cpu使用率是如何統計出來的?

這裏的cpu使用率與linux 命令top-H-p<pid> 的線程%CPU類似,一段采樣間隔時間內,當前JVM裏各個線程的增量cpu時間與采樣間隔時間的比例。

工作原理說明:

首先第一次采樣,獲取所有線程的CPU時間(調用的是java.lang.management.ThreadMXBean#getThreadCpuTime()及sun.management.HotspotThreadMBean.getInternalThreadCpuTimes()接口)

然後睡眠等待一個間隔時間(默認為200ms,可以通過-i指定間隔時間)

再次第二次采樣,獲取所有線程的CPU時間,對比兩次采樣數據,計算出每個線程的增量CPU時間

線程CPU使用率 = 線程增量CPU時間 / 采樣間隔時間 * 100%

注意: 這個統計也會產生一定的開銷(JDK這個接口本身開銷比較大),因此會看到as的線程占用一定的百分比,為了降低統計自身的開銷帶來的影響,可以把采樣間隔拉長一些,比如5000毫秒。

使用參考

當前最忙的前N個線程並打印堆棧:

沒有線程ID,包含表示為JVM內部線程,參考dashboard命令的介紹。

cpuUsage為采樣間隔時間內線程的CPU使用率,與dashboard命令的數據一致。

deltaTime為采樣間隔時間內線程的增量CPU時間,小於1ms時被取整顯示為0ms。

time 線程運行總CPU時間。

注意:線程棧為第二采樣結束時獲取,不能表明采樣間隔時間內該線程都是在處理相同的任務。建議間隔時間不要太長,可能間隔時間越大越不准確。
可以根據具體情況嘗試指定不同的間隔時間,觀察輸出結果。

當沒有參數時,顯示第一頁線程的信息

默認按照CPU增量時間降序排列,只顯示第一頁數據。

thread –all, 顯示所有匹配的線程

顯示所有匹配線程信息,有時需要獲取全部JVM的線程數據進行分析。

thread id, 顯示指定線程的運行堆棧

thread -b, 找出當前阻塞其他線程的線程

有時候我們發現應用卡住了, 通常是由於某個線程拿住了某個鎖, 並且其他線程都在等待這把鎖造成的。
為了排查這類問題, arthas提供了thread-b, 一鍵找出那個罪魁禍首。

注意, 目前只支持找出synchronized關鍵字阻塞住的線程, 如果是java.util.concurrent.Lock, 目前還不支持。目前使用效果不佳

thread -i, 指定采樣時間間隔

thread-i1000 : 統計最近1000ms內的線程CPU時間。

thread-n3-i1000 : 列出1000ms內最忙的3個線程棧

thread –state ,查看指定狀態的線程