nagios和zabbix自定义监控脚本

时间:2023-04-22 22:05:44

一. 自定义nagios监控脚本

1. 在客户端上创建脚本/usr/local/nagios/libexec/check_disk.sh
vim  /usr/local/nagios/libexec/check_disk.sh 写入如下内容:(client上)
#!/bin/bash
#!/bin/bash
row=`df -h |wc -l`
for i in `seq 2 $row`
do
        ava=`df -h |sed -n "$i"p|awk '{print $4}'`
        u_per=`df -h |sed -n "$i"p|sed -n "s/\%//"p|awk '{print $5}'`
        p_p=`df -h -P|sed -n "$i"p|awk '{print $6}'`
        if [ "$u_per" -gt "97"  ];then
                echo -n "$p_p CRITICAL $u_per% $ava  "
                sta[$i]=2
        elif [ "$u_per" -gt "95" ];then
                echo -n "$p_p WARNING! $u_per% $ava  "
                sta[$i]=1
        else
                echo -n "$p_p OK $u_per% $ava  "
                sta[$i]=0
        fi
done
n=0
for j in `seq 2 $row`
do
        if [ "${sta[$j]}" -gt $n  ];then
                n=${sta[$j]}
        fi
done
exit $n

2. 保存后,修改该脚本的权限
chmod +x  /usr/lib/nagios/plugins//check_disk.sh (client上)
3. 然后编辑/etc/nagios/nrpe.cfg文件
vim /etc/nagios/nrpe.cfg  # 加入一行:(client上)
command[check_disk]=/usr/lib/nagios/plugins/check_disk.sh
保存,重启nrpe服务
/etc/init.d/nrpe restart (client上)
4. 检测刚才的脚本是否正常运行的方法是,到server端执行如下命令:
check_nrpe -H 192.168.0.12 -c check_disk (server上)
如果正常的话,会输出一行磁盘检测的数据,否则可能会报错。
5. 到server上添加相应的service
cd /etc/nagios/conf.d/
vim 192.168.0.12.cfg     # 加入如下内容:
define service{
        use     generic-service
        host_name       192.168.0.12
        service_description     check_disk
        check_command           check_nrpe!check_disk
        max_check_attempts 5
        normal_check_interval 1
}
6. 重启nagios服务
/etc/init.d/nagios restart   (server上)

二. 自定义zabbix脚本
1.  在客户端修改配置文件  /etc/zabbix/zabbix_agentd.conf
需要改动两个地方:

  1. (1)  UnsafeUserParameters=1
  2. (2) UserParameter=my.net.if【*】(改成英文的方括号), /usr/local/sbin/zabbix/net.sh $1 $2   //其中UserParameter用来自定义键值,(类似于net.if.in),自己写的脚本往往会有参数,所以需要加,这是固定写法,如果脚本压根就没有什么参数,那么这个就省了。逗号后面就是我们写的脚本的路径了,再后面就是要用到的参数,有几个就写几。

2. 编写脚本
vi   /usr/local/sbin/zabbix/net.sh   //内容如下

#!/bin/bash
eth=$1
io=$2
net_file="/proc/net/dev"
if [ $2 == "in" ]
then
    n_new=`grep "$eth" $net_file|awk '{print $2}'`
    n_old=`tail -1 /tmp/neti.log`
    n=`echo "$n_new-$n_old"|bc`
    d_new=`date +%s`
    d_old=`tail -2 /tmp/neti.log|head -1`
    d=`echo "$d_new-$d_old"|bc`
    if_net=`echo "$n/$d"|bc`
    echo $if_net
    date +%s>>/tmp/neti.log
    grep "$eth" $net_file|awk '{print $2}'>>/tmp/neti.log
elif [ $2 == "out" ]
then
    n_new=`grep "$eth" $net_file|awk '{print $10}'`
    n_old=`tail -1 /tmp/neto.log`
    n=`echo "$n_new-$n_old"|bc`
    d_new=`date +%s`
    d_old=`tail -2 /tmp/neto.log|head -1`
    d=`echo "$d_new-$d_old"|bc`
    if_net=`echo "$n/$d"|bc`
    echo $if_net
    date +%s>>/tmp/neto.log
    grep "$eth" $net_file|awk '{print $10}'>>/tmp/neto.log
else
    echo 0
fi

这个脚本的思路,就是通过查看文件 /proc/net/dev  里面的数值,来计算实时网卡流量,其实我算的是一个平均值。分为进和出。如果这个脚本每隔1分钟执行一次,那么算出来的流量值就是1分钟的平均值。

3.  在脚本执行前,需要先做一个操作
touch /tmp/net[io].log
date +%s >>/tmp/neti.log
grep eth0 /proc/net/dev |awk '{print $2}' >>/tmp/neti.log
date +%s >>/tmp/neto.log
grep eth0 /proc/net/dev |awk '{print $10}' >>/tmp/neto.log
chown zabbix  /tmp/net[io].log

4. 检查脚本是否可用
在服务端执行
zabbix_get -s 192.168.31.166 -p10050 -k "my.net.if[eth0,out]"

5. 如果可以返回数值说明没问题了,接着在浏览器里面配置
组态 --> 主机 --> 项目  --> 创建监控项
名称 “网卡流量出”
类型默认“zabbix代理”
键值  "my.net.if[eth0,out]"
数据更新间隔  60
存档

三.  mysql备份脚本
1. 最简单的
#!/bin/bash
d=`date +%w`
/usr/bin/mysqldump -umylinux -pxxxxx mylinux >/data/mysqlbak/$d.sql

2. 稍微复杂的
#! /bin/bash

STORE_NAME=`date +%m%d`
STORE_NAME2=`date +%w`
STORE_DIR='/backup/mysqlbak'
REMOTE_DIR='ypl-web:/backup'
BACKUP_DIR='/data/mysql/'
exec 1>/var/log/mysqlbak.log 2>&1
echo mysqlbak start `date`

/etc/init.d/mysqld stop
sleep 2
killall -9 mysqld; sleep 2
killall -9 mysqld
/usr/bin/rsync -azu $BACKUP_DIR $STORE_DIR/$STORE_NAME2
/etc/init.d/mysqld start

for db in ypl 1yplcc ypl913 ecshop wordpress 
do
    /usr/local/mysql/bin/mysqldump  -uroot -p'xxx' $db >$STORE_DIR/$db-$STORE_NAME.sql
echo mysqlbak end `date`

cd $STORE_DIR
for db in ypl 1yplcc ypl913 ecshop wordpress 
do
    gzip   -f  $db-$STORE_NAME.sql
done
find $STORE_DIR/*.sql.gz  -mtime +6 |xargs rm -f

echo remote bak start `date`
/usr/bin/rsync -azu --delete $STORE_DIR $REMOTE_DIR/
echo remote bak end `date`

3. innodb引擎,超大数据库备份
#!/bin/bash
## mysql backup daily 3306 and 3307.
exec 2> /BACKUP/mysqlbackup/bak.err

innb="/usr/bin/innobackupex"
opt="--user=backup \
     --password=bakBAK001 \
     --defaults-file=/etc/my.cnf "
bakdir="/BACKUP/mysqlbackup/whole"

bak() {
    $innb $opt --socket=$1 $bakdir/$2
}

bak /tmp/mysql1.sock 3306 >/tmp/3306.bak
bak /tmp/mysql2.sock 3307 >/tmp/3307.bak

find /BACKUP/mysqlbackup/whole/ -type f -mtime +7 |xargs rm -f

innobackupex如何安装  http://www.apelearn.com/bbs/thread-1012-1-1.html