【Linux性能分析命令--top】

时间:2022-12-08 17:59:03

top命令

top命令入门级别命令, 常用于查看linux系统中进程的资源使用情况,也是最常用的性能分析命令

[root@centos7 ~]# top
top - 21:23:58 up 1:55, 3 users, load average: 0.00, 0.01, 0.05
Tasks: 158 total, 1 running, 157 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 1882348 total, 901852 free, 150644 used, 829852 buff/cache
KiB Swap: 2097148 total, 2097148 free, 0 used. 1566640 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
2443 root 20 0 162124 2300 1588 R 0.3 0.1 0:00.10 top
1 root 20 0 128000 6628 4144 S 0.0 0.4 0:01.16 systemd
2 root 20 0 0 0 0 S 0.0 0.0 0:00.01 kthreadd
4 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H
6 root 20 0 0 0 0 S 0.0 0.0 0:00.90 ksoftirqd/0

3 users:

有三个终端连接进来了。 不是3个用户名(账户)

系统平均负载

load average: 0.00, 0.01, 0.05 系统的平均负载值

  • 第1个值: 系统过去1分钟的平均负载值
  • 第2个值:系统过去5分钟的平均负载值
  • 第3个值:系统过去15分钟的平均负载值

如果第1个值很大,则表示当前系统负载比较高。 参考值是cpu的核数,如果超过cpu核数的80%,我们就认为目前系统负载很高。

查看cpu核数:

cat /proc/cpuinfo\  top 按下数字1、  lscpu

第1个值,远远大于第2个值,服务器最近这个时间压力陡然上升,可能还会继续上升。

第2个值,大于第1个值,说明系统的负载\压力正在释放。

注意:

  • 1、我们平时用jmeter做性能测试时,完成一轮性能测试之后,要休息一定时间,就是要看load 第1个值,要慢慢恢复正常之后,才来执行第二轮测试。如果没有恢复正常,就开始第2轮,可能会因为前一轮压力没有释放而影响第2轮性能数据,从而导致两轮数据相差很大。
  • 2、load值,是由 cpu使用率 + io使用率 两个来绝对。 并不是完全由cpu的使用率来决定。

任务信息汇总

  • Tasks: 185 total, 1 running, 184 sleeping, 0 stopped, 0 zombie
  • Tasks: 进程数
  • running: 正在运行中进程
  • sleeping: 暂时休息状态
  • stopped: 已经停止
  • zombie: 僵尸进程
  • 这些值,与进程列表中 S 列对应
  • S: sleeping
  • R: running
  • Z: zombie
  • T: stopped
  • 按下 H
  • Threads: 170 total, 1 running, 169 sleeping, 0 stopped, 0 zombie
  • Thread: 线程
  • tasks数字 比 thread数字: 线程数字要大, 一个进程至少会有1个线程

cpu信息

%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st

  • 无论系统中有多少个 CPU 核心,默认的 CPU 信息总是输出一行,即所有核心加起来的综合数据。按键盘上的数字 1,查看各个 CPU 核心单独的数据

%Cpu(s): 所有cpu一起的使用率, 系统中不管多少个cpu,cpu总的使用率情况
%Cpu(数字):具体的某一个cpu的使用率情况。

我们平时说cpu使用率不能超过80% -----指的是总的%Cpu(s)

  • us\us%: 用户态使用率,进程在用户地址空间中消耗 CPU 时间的百分比。像 shell程序、各种语言的编译器、数据库应用、web 服务器和各种桌面应用都算是运行在用户地址空间的进程。这些程序如果不是处于 idle 状态,那么绝大多数的 CPU 时间都是运行在用户态。
  • sy\sys%: 系统态使用率,进程在内核地址空间中消耗 CPU 时间的百分比。
  • ni: nice 经常优先级切换占用时间百分比,可以通过 nice 值调整进程用户态的优先级。这里显示的 ni 表示调整过 nice 值的进程消耗掉的 CPU 时间。如果系统中没有进程被调整过 nice 值,那么 ni 就显示为 0。
  • id: idle cpu空闲时间占比,一般情况下, us + ni + id 应该接近 100%。
  • wa: wait 等待资源或休息的时间占比,
  • hi: Hardware interrupt,处理硬中断消耗的时间
  • si: Software interrupt,处理软中断消耗的时间
  • st:管理所占用时间比,只有 Linux 在作为虚拟机运行时 st 才是有意义的。它表示虚机等待 CPU 资源的时间(虚机分到的是虚拟 CPU,当需要真实的 CPU 时,可能真实的 CPU 正在运行其它虚机的任务,所以需要等待)。

内存信息

包含两行内容,内存和交换空间:
KiB Mem : 1882196 total, 1626256 free, 125844 used, 130096 buff/cache
KiB Swap: 2097148 total, 2097148 free, 0 used. 1611924 avail Mem

  • 内存信息默认用KB,按下大写字母E切换单位
  • 内存的数据,与进程列表中 VIRT RES SHR
  • VIRT: 虚拟内存
  • RES : 物理内存
  • SHR: 共享内存
  • 任何一个程序,虚拟内存的大小,物理内存的大
  • buff/cache: 缓存
  • buff 缓冲区、由磁盘虚拟而来、它的速度受磁盘的速度的约束,所以,它的速度比内存速度要慢,但是,比磁盘的速度要快,用于从磁盘中读取数据时候的缓存
  • buff 只会加快磁盘数据的 读 速度
  • cache 缓存: 内存cache、cpucache(L1 L2 L3): 加快 IO速度
  • Swap分区:是由磁盘虚拟而来,用于暂存内存中的数据,比内存速度要慢
  • 小写字母 m 可以控制是否显示内存信息。


任务详情

PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND
2443 root 20 0 162124 2300 1588 R 0.3 0.1 0:00.10 top
1 root 20 0 128000 6628 4144 S 0.0 0.4 0:01.16 systemd
2 root 20 0 0 0 0 S 0.0 0.0 0:00.01 kthreadd
4 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H
6 root 20 0 0 0 0 S 0.0 0.0 0:00.90 ksoftirqd/0
  • PID 表示进程 ID。
  • USER 表示进程所有者的有效用户名称。简单说就是以哪个用户权限启动的进程。比如上图中有两个进程是用户 nick 启动的,还有一个是用户 prometheus 启动的,其它都是 root 用户启动的。
  • PR 表示进程执行的优先级,PR 的值是以 Linux 内核的视角看到的进程执行的优先级。
  • NI 从用户视角看到的进程执行优先级。注意上图中 NI 值为 -20 的两个进程,它们的 PR 值都是 0。
  • VIRT 表示进程使用的虚拟内存大小。
  • RES 表示进程使用的物理内存大小。
  • SHR 表示进程使用的共享内存的大小。
  • S 表示进程当前的状态。S 值有下面几种:
  • D 不可中断的睡眠状态(uninterruptible sleep)
  • R 正在运行的状态(running)
  • S 睡眠状态(sleeping)
  • T 跟踪或停止状态(traced or stopped)
  • Z 僵尸状态(zombie)
  • %CPU 表示进程使用 CPU 的百分比。
  • %MEM 表示进程使用内存的百分比。
  • TIME+ 表示进程累计使用的 CPU 时间。
  • COMMAND 表示运行进程对应的程序。