Python 脚本实现对 Linux 服务器的监控

时间:2021-07-27 04:38:42

本文来自我的github pages博客http://galengao.github.io/ 即www.gaohuirong.cn

摘要:

  • 原文地址
  • 由于原文来自微信公众号,并且脚本都是图片,所以这里自己亲自把代码整理执行一遍

工作原理:基于/proc文件

Linux 系统为管理员提供了非常好的方法,使其可以在系统运行时更改内核,而不需要重新引导内核系统,这是通过/proc 虚拟文件系统实现的。/proc 文件虚拟系统是一种内核和内核模块用来向进程(process)发送信息的机制(所以叫做“/proc”),这个伪文件系统允许与内核内部数据结构交互,获取有关进程的有用信息,在运行中(on the fly)改变设置(通过改变内核参数)。与其他文件系统不同,/proc 存在于内存而不是硬盘中。proc 文件系统提供的信息如下:

  • 进程信息:系统中的任何一个进程,在 proc 的子目录中都有一个同名的进程 ID,可以找到 cmdline、mem、root、stat、statm,以及 status。某些信息只有超级用户可见,例如进程根目录。每一个单独含有现有进程信息的进程有一些可用的专门链接,系统中的任何一个进程都有一个单独的自链接指向进程信息,其用处就是从进程中获取命令行信息。

  • 系统信息:如果需要了解整个系统信息中也可以从/proc/stat 中获得,其中包括 CPU 占用情况、磁盘空间、内存对换、中断等。

  • CPU 信息:利用/proc/CPUinfo 文件可以获得*处理器的当前准确信息。

  • 负载信息:/proc/loadavg 文件包含系统负载信息。

  • 系统内存信息:/proc/meminfo 文件包含系统内存的详细信息,其中显示物理内存的数量、可用交换空间的数量,以及空闲内存的数量等。

/proc 目录中的主要文件的说明:

文件或目录名称 描述
apm 高级电源管理系统
cmdline 内核文件启动的命令行
CPUinfo *处理器信息
devices 可以用到的设备(块设备/字符设备)
dma 显示当前使用的DMA通道
filesystems 核心配置的文件系统
ioports 当前使用的I/O端口
interrupts 这个文件的每一行都有一个保留终端
kcore 系统物理内存映像
kmsg 核心输出的消息,被送到日志文件
mdstat 这个文件包括由MD设备驱动程序控制的RAID设备信息
loadavg 系统平均负载均衡
meminfo 存储器使用信息,包括物理内存和交换内存
modules 这个文件给出可加载的内核模块,lsmod程序显示有关模块名称
net 网络协议状态信息
partitions 系统识别的分区表
pci pci设备信息
scsi scsi设备信息
self 到查看/proc程序进程目录的符号链接
stat 包含CPU利用率,内存页、内存兑换、磁盘,全部中断,接触开关自举时间
swaps 交换分区的使用情况
uptime 给出系统自从上次自举以来的秒数,以及有多少秒处于空闲
version 这个文件只有一行内容,说明运行内核版本

Python脚本对linux服务器的监控

对于CPU的监控

获取CPU信息

  • 脚本
#!/usr/bin/env python

from __future__ import print_function
from collections import OrderedDict
import pprint def CPUinfo():
''' Return the informaton in /proc/CPUinfo
as a dictionary in the following format:
CPU_info['proc0']={...}
CPU_info['proc1']={...}
'''
CPUinfo=OrderedDict()
procinfo=OrderedDict() nprocs = 0
with open('/proc/cpuinfo') as f:
for line in f:
if not line.strip():
# end of one processor
CPUinfo['proc%s' % nprocs] = procinfo
nprocs=nprocs+1
# reset
procinfo=OrderedDict()
else:
if len(line.split(':')) == 2:
procinfo[line.split(':')[0].strip()] = line.split(':')[1].strip()
else:
procinfo[line.split(':')[0].strip()] = ''
return CPUinfo if __name__=='__main__':
CPUinfo = CPUinfo()
for processor in CPUinfo.keys():
print(CPUinfo[processor]['model name'])
  • 结果
[root@cdtest ~]# python cpu.py   

Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40GHz
Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40GHz

对于系统负载的监控

获取负载信息

  • 脚本
#!/usr/bin/env python

import os
def load_stat():
loadavg = {}
f = open("/proc/loadavg")
con = f.read().split()
f.close()
loadavg['lavg_1']=con[0]
loadavg['lavg_5']=con[1]
loadavg['lavg_15']=con[2]
loadavg['nr']=con[3]
loadavg['last_pid']=con[4]
return loadavg
print ("loadavg",load_stat()['lavg_15'])
  • 结果
[root@cdtest ~]# python cpu2.py 

('loadavg', '0.00')

对于系统内存的监控

获取内存信息

  • 脚本
#!/usr/bin/env python

from __future__ import print_function
from collections import OrderedDict def meminfo():
''' Return the information in /proc/meminfo
as a dictionary '''
meminfo=OrderedDict() with open('/proc/meminfo') as f:
for line in f:
meminfo[line.split(':')[0]] = line.split(':')[1].strip()
return meminfo if __name__=='__main__':
meminfo = meminfo()
print('Total memory:{0}'.format(meminfo['MemTotal']))
print('Free memory:{0}'.format(meminfo['MemFree']))
  • 结果
[root@cdtest ~]# python cpu3.py   

Total memory:3925652 kB
Free memory:2999584 kB

对于网络接口的监控

获取网络信息

  • 脚本
#!/usr/bin/env python

import time
import sys if len(sys.argv)>1:
INTERFACE = sys.argc[1]
else:
INTERFACE = 'eth0'
STATS = []
print ('Interface:',INTERFACE) def rx():
ifstat = open('/proc/net/dev').readlines()
for interface in ifstat:
if INTERFACE in interface:
stat = float(interface.split()[1])
STATS[0:] = [stat] def tx():
ifstat = open('/proc/net/dev').readlines()
for interface in ifstat:
if INTERFACE in interface:
stat = float(interface.split()[9])
STATS[1:] = [stat] print ('In Out')
rx()
tx() while True:
time.sleep(1)
rxstat_o = list(STATS)
rx()
tx()
Rx = float(STATS[0])
Rx_o = rxstat_o[0]
Tx = float(STATS[1])
Tx_o = rxstat_o[1]
RX_RATE = round((Rx-Rx_o)/1024/1024,3)
TX_RATE = round((Tx-Tx_o)/1024/1024,3)
print(RX_RATE,'MB ',TX_RATE,'MB ')
  • 结果
[root@cdtest ~]# python cpu4.py 

('Interface:', 'eth0')
In Out
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.002, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')
(0.0, 'MB ', 0.0, 'MB ')

对于系统某进程的监控

获取进程信息

  • 脚本
#!/usr/bin/env python

import os,sys,time

while True:
time.sleep(4)
try:
ret = os.popen('ps -C apache -o pid,cmd').readlines()
if len(ret) < 2:
print ("apache exit,4s restart")
time.sleep(3)
os.system("service apache restart")
except:
print("error")
 
  • 结果  该结果要系统上有相应的进程才行,可以根据自己需要监控什么进程修改脚本
 

Python 脚本实现对 Linux 服务器的监控的更多相关文章

  1. 用 Python 脚本实现对 Linux 服务器的监控

    目前 Linux 下有一些使用 Python 语言编写的 Linux 系统监控工具 比如 inotify-sync(文件系统安全监控软件).glances(资源监控工具)在实际工作中,Linux 系统 ...

  2. 用 Python 脚本实现对 Linux 服务器的网卡流量监控

    *这篇文章网上已经有相关代码,为了加深印象,我做了相关批注,希望对朋友们有帮助 工作原理:基于/proc文件系统 Linux 系统为管理员提供了非常好的方法,使其可以在系统运行时更改内核,而不需要重新 ...

  3. Linux 服务器系统监控脚本 Shell【转】

    转自: Linux 服务器系统监控脚本 Shell - 今日头条(www.toutiao.com)http://www.toutiao.com/i6373134402163048961/ 本程序在Ce ...

  4. Linux服务器上监控网络带宽的18个常用命令 zz

    Linux服务器上监控网络带宽的18个常用命令 本文介绍了一些可以用来监控网络使用情况的Linux命令行工具.这些工具可以监控通过网络接口传输的数据,并测量目前哪些数据所传输的速度.入站流量和出站流量 ...

  5. Linux服务器上监控网络带宽的18个常用命令和工具

    一.如何查看CentOS的网络带宽出口 检查维护系统的时候,经常会要查看服务器的网络端口是多大的,所以需要用到Linux的一个命令. 如何查看CentOS的网络带宽出口多大?可以用下面的命令来查看. ...

  6. Linux服务器上监控网络带宽的18个常用命令nload&comma; iftop&comma;iptraf-ng&comma; nethogs&comma; vnstat&period; nagios,运用Ntop监控网络流量

    Linux服务器上监控网络带宽的18个常用命令 本文介绍了一些可以用来监控网络使用情况的Linux命令行工具.这些工具可以监控通过网络接口传输的数据,并测量目前哪些数据所传输的速度.入站流量和出站流量 ...

  7. linux 服务器性能监控(一)

    这篇文章主要介绍一些常用的linux服务器性能监控命令,包括命令的常用参数.指标的含义以及一些交互操作. 几个问题 命令本身并不复杂,关键是你对操作系统基础知识的掌握和理解,先来看看下面几个问题: C ...

  8. Python中实现对list做减法操作介绍

    Python中实现对list做减法操作介绍 这篇文章主要介绍了Python中实现对list做减法操作介绍,需要的朋友可以参考下 问题描述:假设我有这样两个list, 一个是list1,list1 = ...

  9. Linux服务器上监控网络带宽的18个常用命令

    [51CTO精选译文]本文介绍了一些可以用来监控网络使用情况的Linux命令行工具.这些工具可以监控通过网络接口传输的数据,并测量目前哪些数据所传输的速度.入站流量和出站流量分开来显示. 一些命令可以 ...

随机推荐

  1. &lbrack;小北De编程手记&rsqb; &colon; Lesson 06 玩转 xUnit&period;Net 之 定义自己的FactAttribute

    xUnit.Net本身提供了标记测试方法的标签Fact和Theory.在前面的文章<Lesson 02 玩转 xUnit.Net 之 基本UnitTest & 数据驱动>中,也对它 ...

  2. MongoDB入门简介

    MongoDB入门简介 http://blog.csdn.net/lolinzhang/article/details/4353699 有关于MongoDB的资料现在较少,且大多为英文网站,以上内容大 ...

  3. 命令行分析java线程CPU占用

    1.使用top命令找出占用cpu最高的JAVA进程pid号 2. 找出占用cpu最高的线程: top -Hp  -n 1 3. 打印占CPU最高JAVA进程pid的堆栈信息 jstack pid &g ...

  4. Linux学习之nl命令

    nl命令在linux系统中用来计算文件中行号.nl 可以将输出的文件内容自动的加上行号!其默认的结果与 cat -n 有点不太一样, nl 可以将行号做比较多的显示设计,包括位数与是否自动补齐 0 等 ...

  5. ie6与固定定位fixed&comma;&plus; 条件注释格式注意

    ie6并不支持position:fixed, ie7+都支持fixed定位, ie6固定定位实现方法1: <!DOCTYPE html> <html> <head> ...

  6. Mybatis jpa mini 代码解析

    源码地址(git):https://github.com/LittleNewbie/mybatis-jpa 一.Mybatis简介 mybatis中文官方文档:http://www.mybatis.o ...

  7. PHP&lpar;一&rpar;OOP基础

    [面向过程&面向对象] 1.面向过程:专注于解决一件事情的过程.最大的特点,是有一个个函数来实现功能需求 2.面向对象:专注于有哪一个对象来实现这个功能,最大的特点,时产生一个个具有属性和方法 ...

  8. linux应用态下的时间

    1.时间值 1.1 日历时间(UTC) 该值是自1 9 7 0年1月1日0 0 : 0 0 : 0 0以来国际标准时间( U T C)所经过的秒数累计值(早期的手册称 U T C为格林尼治标准时间) ...

  9. HashSet与TreeSet

    1.TreeSet 是二差树实现的,Treeset中的数据是自动排好序的,不允许放入null值 2.HashSet 是哈希表实现的,HashSet中的数据是无序的,可以放入null,但只能放入一个nu ...

  10. DHCP机制

    DHCP概念:局域网的网络协议,使用UDP协议工作,在工作过程中,它有两个对象,DHCP客户端和DHCP服务端,DHCP服务运行在67端口和68端口. 用途:1)个内部网络或网络服务供应商自动分配IP ...