zabbix监控网卡流量的一些事情

时间:2024-02-24 12:20:26

对象:监控linux物理服务器的网卡流量情况

模板:采用之前同事留下的模板 Linux template for physical server ,网上也能搜到。

监控方式:自动发现

可以用zabbix_get -s hostname -p 10050 -k net.if.discovery 去获取目标设备的所有信息。

此发现规则匹配的正则表达式为

正则表达式的内容可以在管理-一般-右上角选择正则表达式查看。

默认的是^(eth0|eth1|eth2|eth3|bond0|bond1)$。就是匹配这5块。eth0,1,2,3是单块的网卡,bond是单块网卡流量的2倍(具体为什么,我也不了解)。也就是千兆的网卡,那么做了bond后,就是2千兆。所有下面的阈值设置是按照bond给的。

模板的trigger设置的是

 

由于单块网卡最大是千兆,所所以此阈值不适合eth0,1,2,3。

问题1:如何监控单块网卡的流量,阈值设为600M

问题2:如何监控万兆网卡的流量。

先说问题2,很简单,就是将原模板克隆,将此发现里面的阈值调整为10倍即可,即10000M和16000M。

再说问题1:首先是想着在模板上单独建一个监控单一网卡如eth0的item,但是由于自动发现中会产生要监控的网卡eth0的item了,导致没办法新增或更新。

解决,1,首先更改正则表达式,建议新增一个,不要在原来的上面改动,以防有其它的模板也使用这个,会受到影响。

    2, 然后将模板里的自动发现中的过滤器的宏替换,那么此模板只会发现bond0,1,触发器也是针对的bond0,1.

            3,在模板的item里面新增item,如下

比着自动发现里的item做就行。

        4,新增对应的trigger

   5,更新模板,过一会去查看是否都能采集到数据

补充下:item里的设置

另外我在更新模板的时候有些报有些设备以及存在此item,无法更新:1个原因是调整完触发器后,时间较短,自动发现还未更新数据,需要等待几分钟;2是有些添加了此模板的设备处于未监控状态,你更改了1,未监控的设备不会再执行自动发现了,导致之前发现的item一直存在,需要把这些设备unlink掉模板即可。