通过使用zabbix 日志监控 我发现一个问题 例如oracle的日志有报错的情况 ,通常不会去手动清理 这样的话当第二次有日志写进来的时候 zabbix的机制是回去检查全部日志,这样的话之前已经告警过的错误日志,又会被检查到,这样就会出现重复告警,而且zabbix的日志监控只能读到匹配当前行关键字的数据,感觉不太灵活, 比如我想要匹配到的关键字之后再当前关键字的下N行再去匹配另一个关键字这个时候就比较麻烦,在这里给大家推荐一个有效,便捷解决的方式。
通过Python脚本实现日志监控 要求 1 记录脚本检查日志位置,避免下次触发脚本的时候出现重复告警 2 关键字匹配支持正则 3 支持多个关键字查询,例如第一个关键字匹配到当之后在这个关键字的下N行再去匹配第二个关键字 具体传参格式
python3 npar.py /u03/z.txt '(ORA-|REEOR),(04030|02011)' 2
第一个参数是日志路径 第二个参数是关键字 第三个参数为 匹配到第一个表达式这种的关键字后再去地 N(2)行去匹配第二个关键词(04030|02011)具体脚本实现如下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
|
import os
import sys
logtxt = "logtxt.txt"
def read_txt(files, start_line):
data = []
data.append("")
with open(str(files) + "", "r",
encoding = 'UTF-8') as f:
for line in f.readlines():
line = line.strip('\n')# 去掉列表中每一个元素的换行符
data.append(line)
# 记录本次的行数
wirte_log(len(data) - 1)
if len(data) > start_line:
return data[start_line - 1: ]
else :
print("开始行数大于文本文件总行数!")
def wirte_log(lines):
global logtxt
with open(logtxt, "w") as file: #”w "代表着每次运行都覆盖内容
file.write(str(lines))
def read_log():
global logtxt
if not os.path.exists(logtxt):
with open(logtxt, "w") as file: #”w "代表着每次运行都覆盖内容
file.write(str(1))
with open(logtxt + "", "r", encoding =
'UTF-8') as f:
s_lines = f.readlines()
print("从第" + str(s_lines[0]) + "行开始")
return s_lines[0]
def deal_read_log(files, keyword,
interval_line):
keywords = keyword.replace("(", "").replace(
")", "").replace("'", "").replace('"',
'"').split(',')
start_keywords = keywords[0].split("|")
end_keywords = keywords[1].split("|")
start_line = read_log()
lines_data = read_txt(files, int(
start_line))
for_line = 1
while (for_line < len(lines_data)):
#print(for_line)
# print(lines_data[for_line])
#
if end_keywords in lines_data[for_line]:
#print(lines_data[for_line])
# print("-------------------")
# for_line = for_line + 1
#
else :
isexist = 0
for sk in start_keywords:
if sk in lines_data[for_line]:
isexist = 1
break;
if isexist == 1:
#if start_keywords[0] in lines_data[
for_line] or start_keywords[1] in
lines_data[for_line]:
#当前行有end_keywords
isexist2 = 0
for sk in end_keywords:
if sk in lines_data[for_line]:
isexist2 = 1
break;
if isexist2 == 1:
#print("行数=" + str(start_line - 1 +
for_line) + "-" + str(start_line - 1 +
for_line))
print(lines_data[for_line])
else :
#当前行没有end_keywords。 往下interval_line行去寻找
# 标记当前行数
flag_line = for_line
count = 1
for_line = for_line + 1
while (for_line < len(lines_data)):
isexist3 = 0
for sk in end_keywords:
if sk in lines_data[for_line]:
isexist3 = 1
break;
if isexist3 == 1:
#print("行数=" + str(start_line - 1 +
flag_line) + "-" + str(start_line -
1 + for_line))
for prin in range(flag_line, for_line +
1):
print(lines_data[prin])
break;
for_line = for_line + 1
if count == int(interval_line):
break;
count = count + 1
for_line = for_line - 1
for_line = for_line + 1
if name == 'main':
files = sys.argv[1]
if '.log' in files:
logtxt = files.replace(".log",
"_log.txt")
else :
logtxt = files.replace(".txt",
"_log.txt")
# files = "ora.txt"
keywords = sys.argv[2]
# keywords = "'((04030|04000),ORA-)'"
#上下关联行数
interval_line = int(sys.argv[3])
# interval_line = 10
deal_read_log(files, keywords,
interval_line)
|
接下来就是添加监控了
在agent的conf 文件里面添加UserParameter
到这里监控就完成了
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.51cto.com/14483703/2519876