03: shell简单监控脚本

时间:2021-02-08 10:49:21

1.1 监控apache web server

#! /bin/bash
# apache
netstat -anpt | grep 80 &> /dev/null
if [ $? -eq 0 ];then
str = "apache is running"
else
str = "apache is not running"
service httpd start
fi
echo $str

1.2 初始化系统

  1、初始化centos系统脚本

#/bin/bash
#1. 设置时区并同步时间
ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
if ! crontab -l |grep ntpdate &>/dev/null ; then
(echo "* 1 * * * ntpdate time.windows.com >/dev/null 2>&1";crontab -l) |crontab
fi #2. 禁用selinux
sed -i '/SELINUX/{s/permissive/disabled/}' /etc/selinux/config #3. 关闭防火墙
if egrep "7.[0-9]" /etc/redhat-release &>/dev/null; then
systemctl stop firewalld
systemctl disable firewalld
elif egrep "6.[0-9]" /etc/redhat-release &>/dev/null; then
service iptables stop
chkconfig iptables off
fi #4. 历史命令显示操作时间
if ! grep HISTTIMEFORMAT /etc/bashrc; then
echo 'export HISTTIMEFORMAT="%F %T `whoami` "' >> /etc/bashrc
fi #5. SSH超时时间
if ! grep "TMOUT=600" /etc/profile &>/dev/null; then
echo "export TMOUT=600" >> /etc/profile
fi #6. 禁止root远程登录
# sed -i 's/#PermitRootLogin yes/PermitRootLogin no/' /etc/ssh/sshd_config #7. 禁止定时任务向发送邮件
# sed -i 's/^MAILTO=root/MAILTO=""/' /etc/crontab #8. 设置最大打开文件数
if ! grep "* soft nofile 65535" /etc/security/limits.conf &>/dev/null; then
cat >> /etc/security/limits.conf << EOF
* soft nofile 65535
* hard nofile 65535
EOF
fi #9. 系统内核优化
cat >> /etc/sysctl.conf << EOF
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_max_tw_buckets = 20480
net.ipv4.tcp_max_syn_backlog = 20480
net.core.netdev_max_backlog = 262144
net.ipv4.tcp_fin_timeout = 20
EOF #10. 减少SWAP使用
echo "" > /proc/sys/vm/swappiness #11. 安装系统性能分析工具及其他
yum install gcc make autoconf vim sysstat net-tools iostat iftop iotp lrzsz -y

init_sys.sh

1.3 发送告警邮件

  1、使用163邮箱发送报警邮件 

[root@linux-node1 testsh]# yum -y install mailx     # 首先安装发送邮件的服务
[root@linux-node1 testsh]# echo "Test email content" | mail -s "Mail Title" xiaonaiqiang110@163.com
# yum install mailx
# vi /etc/mail.rc
set from=xiaonaiqiang110@163.com smtp=smtp.163.com
set smtp-auth-user=xiaonaiqiang110@163.com smtp-auth-password=xxxxx
set smtp-auth=login

vim /etc/mail.rc

1.4 批量创建10个系统用户

  1、命令行创建用户方法

[root@linux-node1 testsh]# useradd zhangsan                           # 创建用户 zhangsan
[root@linux-node1 testsh]# echo 123456 | passwd --stdin zhangsan # 给zhangsan设置密码 123456
[root@linux-node1 testsh]# echo $RANDOM |md5sum |cut -c 1-8 # 生成随机数字

  2、使用shell脚本批量创建10个系统用户

#!/bin/bash
USER_FILE=./user.info
for USER in user{1..10}
do
if ! id $USER &>/dev/null
then
PASS=$(echo $RANDOM | md5sum |cut -c 1-8)
useradd $USER
echo $PASS | passwd --stdin $USER
echo "$USER $PASS" >> $USER_FILE
echo "$USER User create successful"
else
echo "$USER User already exit"
fi
done

create_user.sh

1.5 查看服务器CPU、内存、磁盘、TCP连接状态脚本

  1、shell脚本 查看服务器资源使用率

#!/bin/bash
function cpu() {
NUM=1
while [ $NUM -le 3 ]; do
util=`vmstat |awk '{if(NR==3)print 100-$15"%"}'`
user=`vmstat |awk '{if(NR==3)print $13"%"}'`
sys=`vmstat |awk '{if(NR==3)print $14"%"}'`
iowait=`vmstat |awk '{if(NR==3)print $16"%"}'`
echo "CPU - 使用率: $util , 等待磁盘IO响应使用率: $iowait"
let NUM++
sleep 1
done
} function memory() {
total=`free -m |awk '{if(NR==2)printf "%.1f",$2/1024}'`
used=`free -m |awk '{if(NR==2) printf "%.1f",($2-$NF)/1024}'`
available=`free -m |awk '{if(NR==2) printf "%.1f",$NF/1024}'`
echo "内存 - 总大小: ${total}G , 使用: ${used}G , 剩余: ${available}G"
} function disk() {
fs=$(df -h |awk '/^\/dev/{print $1}')
for p in $fs; do
mounted=$(df -h |awk '$1=="'$p'"{print $NF}')
size=$(df -h |awk '$1=="'$p'"{print $2}')
used=$(df -h |awk '$1=="'$p'"{print $3}')
used_percent=$(df -h |awk '$1=="'$p'"{print $5}')
echo "硬盘 - 挂载点: $mounted , 总大小: $size , 使用: $used , 使用率: $used_percent"
done
} function tcp_status() {
summary=$(ss -antp |awk '{status[$1]++}END{for(i in status) printf i":"status[i]" "}')
echo "TCP连接状态 - $summary"
} cpu
memory
disk
tcp_status

check_resource.sh

CPU - 使用率: 3% , 等待磁盘IO响应使用率: 0%
CPU - 使用率: 3% , 等待磁盘IO响应使用率: 0%
CPU - 使用率: 3% , 等待磁盘IO响应使用率: 0%
内存 - 总大小: 1.8G , 使用: 0.9G , 剩余: 0.9G
硬盘 - 挂载点: / , 总大小: 37G , 使用: 3.0G , 使用率: 8%
硬盘 - 挂载点: /boot , 总大小: 1014M , 使用: 179M , 使用率: 18%
TCP连接状态 - LISTEN:11 ESTAB:3 State:1

脚本执行结果

  2、使用命令查看对应资源

    1)查看系统CPU:使用率、用户使用率、系统使用率、IO等待

[root@linux-node1 shdir]# vmstat |awk '{if(NR==3)print 100-$15"%"}'
# 查看系统CPU使用率(100-$15) -- $15获取的是CPU idle空闲率
[root@linux-node1 shdir]# vmstat
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
2 0 2568 182948 0 1058124 0 0 8 49 108 157 2 1 97 0 0

vmstat:查看CPU使用情况

#!/bin/bash
function cpu() {
NUM=1
while [ $NUM -le 3 ]; do
util=`vmstat |awk '{if(NR==3)print 100-$15"%"}'`
user=`vmstat |awk '{if(NR==3)print $13"%"}'`
sys=`vmstat |awk '{if(NR==3)print $14"%"}'`
iowait=`vmstat |awk '{if(NR==3)print $16"%"}'`
echo "CPU - 使用率: $util , 等待磁盘IO响应使用率: $iowait"
let NUM++
sleep 1
done
} cpu '''
执行结果:
CPU - 使用率: 3% , 等待磁盘IO响应使用率: 0%
CPU - 使用率: 3% , 等待磁盘IO响应使用率: 0%
CPU - 使用率: 3% , 等待磁盘IO响应使用率: 0%
'''

cpu.sh

    2)查看系统内存:总量、使用量、空闲量、使用百分比

[root@linux-node1 shdir]# free -m |awk '{if(NR==2)printf "%.1f",$2/1024}'
1.8
# 取出第二行第二列的值(总内存)
# printf "%.1f" (使用格式化输出,保留一位小数)

free -m:查看内存使用情况

#!/bin/bash
function memory() {
total=`free -m |awk '{if(NR==2)printf "%.1f",$2/1024}'`
used=`free -m |awk '{if(NR==2) printf "%.1f",($2-$NF)/1024}'`
available=`free -m |awk '{if(NR==2) printf "%.1f",$NF/1024}'`
echo "内存 - 总大小: ${total}G , 使用: ${used}G , 剩余: ${available}G"
} memory # 执行结果:内存 - 总大小: 1.8G , 使用: 0.9G , 剩余: 0.9G

memory.sh

    3)查看磁盘分区挂载点:总大小、使用量、剩余量、使用百分比

[root@linux-node1 shdir]# df -h |awk '/^\/dev/{print $1}'       # 只有以dev开头的才是我们创建的分区
/dev/mapper/cl-root
/dev/sda1
# /^\/dev 匹配以 /dev开头的所有行 [root@linux-node1 shdir]# p=/dev/sda1
[root@linux-node1 shdir]# df -h |awk '$1=="'$p'" {print $NF}' # 当对应行以"/dev/sda1"开头时打印对应哪行的挂载分区

df -h: 查看磁盘使用情况

#!/bin/bash
disk() {
fs=$(df -h |awk '/^\/dev/{print $1}')
for p in $fs; do
mounted=$(df -h |awk '$1=="'$p'"{print $NF}')
size=$(df -h |awk '$1=="'$p'"{print $2}')
used=$(df -h |awk '$1=="'$p'"{print $3}')
used_percent=$(df -h |awk '$1=="'$p'"{print $5}')
echo "硬盘 - 挂载点: $mounted , 总大小: $size , 使用: $used , 使用率: $used_percent"
done
} disk # 执行结果:
# 硬盘 - 挂载点: / , 总大小: 37G , 使用: 2.9G , 使用率: 8%
# 硬盘 - 挂载点: /boot , 总大小: 1014M , 使用: 179M , 使用率: 18%

disk.sh

    4)查看TCP连接状态:监听TCP个数、建立TCP连接个数

[root@linux-node1 shdir]# netstat -anpt | awk '{a[$6]++}ENDprint a'
LISTEN 11
ESTABLISHED 3
established) 1
Foreign 1 # {a[$6]++} 以第6列值作为key进行循环,每遇到一次key对应的值加一,最终的每个key出现的次数
# 数组里面是一个key对应一个值,统计完后使用for循环遍历这个数组,然后打印出它的key和它的值

netstat -anpt:查看TCP连接

#!/bin/bash
tcp_status() {
summary=$(ss -antp |awk '{status[$1]++}END{for(i in status) printf i":"status[i]" "}')
echo "TCP连接状态 - $summary"
} tcp_status # 运行结果:TCP连接状态 - LISTEN:11 ESTAB:3 State:1

tcp_status.sh

11111111