shell+钉钉机器人完成java程序中断后自启动和实时监控

时间:2023-03-10 02:13:04
shell+钉钉机器人完成java程序中断后自启动和实时监控

java实时程序在运行过程中偶尔出现异常信息中断的情况,通过shell脚本即可完成自启动。

以下为监控一个实时的java程序的shell脚本。

通过每10秒检查一次java程序的进程,来判断程序是否处于运行中。如果未发现程序,则执行程序的启动脚本。

对于启动过程中的状态信息,会通过钉钉机器人实时发送到监控群中,让维护人员了解到程序的异常。

在脚本中通过maxRetry来设置最大尝试的次数。

#!/bin/sh

#=============== java程序 begin ====================#
function callJavaProgram(){
nohup java -Djava.ext.dirs=lib com.Testjava >& &
}
#=============== java程序 end =======================# #=============== 发送钉钉的消息 begin ================#
# 注意: ${nowtime}对应的日期参数不能有空格
# 注意: ${programe}为执行的jar程序的主程序名
url='https://oapi.dingtalk.com/robot/send?access_token=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx'
programe=TestJava
server=192.168.0.101
content=''
logfile=testjava.log function sendDingtalk(){
java -Djava.ext.dirs=/home/hadoop/shell/robot/lib com.DingtalkRobot \
${} ${} ${} ${} ${}
}
#sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content}
#=============== 发送钉钉的消息 end ==================# # 最大尝试次数
maxRetry=
# 尝试次数计数器
retryTimes= (
while true;
do
# 检测java程序执行的进程个数,如果小于1,则未启动
count=`ps -ef | grep ${programe} | grep -v grep|wc -l`
#echo '进程个数:'$count >> ${logfile}
nowtime=`date --date='0 days ago' "+%Y-%m-%d_%H:%M:%S"` if [ ${count} -lt ]; then retryTimes=$[$retryTimes+] content='检测到程序【'${programe}'】未启动,正在尝试启动......第'"${retryTimes}"'次'
echo ${nowtime} ${content} >> ${logfile}
sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content} if [ $retryTimes -ge $maxRetry ]; then
content='检测到程序【'${programe}'】异常,尝试启动'"${maxRetry}"'次失败,程序退出,请手工解决'
echo ${content} >> ${logfile}
sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content}
break
fi #============== 这里执行java程序 =========================#
callJavaProgram
#============== 这里执行java程序 =========================# else
if [ $retryTimes -gt ]; then
content='程序【'${programe}'】启动成功......第'"${retryTimes}"'次'
echo ${content} >> ${logfile}
sendDingtalk ${url} ${programe} ${server} ${nowtime} ${content}
else
echo ${nowtime} '程序【'${programe}'】......正在运行中' >> ${logfile}
fi
let retryTimes=
fi sleep done
) & >> shell.log

脚本启动后:

可以查看到钉钉群中实时监控信息:

shell+钉钉机器人完成java程序中断后自启动和实时监控

程序启动成功后,提示以下信息:

shell+钉钉机器人完成java程序中断后自启动和实时监控