站点图标 IDC铺

Zabbix监控(二):添加触发器Triggers

1、新建触发器Triggers:

说明:上图中显示的触发器是在Template中创建的,触发值是不能在此直接修改的,必须在template中修改。

点击ADD添加触发器表达式Expression:

点击Select选择已存在监控项Items:

说明:Expression中选择对应的item、触发方式及触发值,Severity是告警级别,根据trigger的严重性来选择2、触发器的表达式Expression1{:.()}。

例如:{hv01:vfs.file.exists[file].last()}=0function就是指last()部分,这里表示最近一次的值,为0时表示文件存在,不为0表示文件不存在3、触发器函数参数function parameter。

(1)abschange· 参数: 直接忽略后边的参数· 支持值类型:float,int, str,text,log· 描述: 返回最近获取到的值与之前的值的差值的绝对值对于字符串类型,0表示值相等,1表示值不同。

(2)avg· 参数: 秒或#num· 支持值类型:float,int· 描述: 返回指定时间间隔的平均值时间间隔可以通过第一个参数通过秒数设置或收集的值的数目(需要前边加上#,比如#5表示最近5次的值) 。

如果有第二个,则表示时间漂移(time shift),例如像查询一天之前的一小时的平均值,对应的函数是avg(3600,86400),时间漂移是Zabbix1.8.2加入进来的(3)change· 参数: 直接忽略掉后边的参数。

· 支持值类型:float,int, str,text,log· 描述: 返回最近获取到的值与之前的值的差值. 对于字符串类型,0表示值相等,1表示值不同(4)count· 参数: 秒或#num· 支持值类型:float,int, str,text,log

· 描述: 返回指定时间间隔内的数值统计时间间隔可以通过第一个参数通过秒数设置或收集的值数目(需要值前边加上#)本函数可以支持第二个参数作为样本(pattern)数据,第三个参数作为操作(operator)参数,第四个参数作为时间漂移(timeshift)参数。

对于样本,整数(iteeger)监控项实用精确匹配,浮点型(float)监控项允许偏差0.0000001支持的操作(operators)类型:eq:相等ne:不相等gt:大于ge:大于等于lt: 小于le: 小于等于

like: 内容匹配对于整数和浮点型监控项目支持eq(默认),ne,gt,ge,lt,le;对于string、text、log监控项支持like(默认),eq,ne例子:count(600):最近10分钟的值的个数

count(600,12):最近10分钟,值等于12的个数count(600,12,”gt”):最近10分钟,值大于12的个数count(#10,12,”gt”):最近的10个值中,值大于12的个数count(600,12,”gt”,86400):24小时之前的前10分钟数据中,值大于12的个数

count(600,,,86400):24小时之前的前10分钟数据的值的个数(5)date· 参数: 直接忽略掉后边的参数· 支持值类型: 所有(any)· 描述: 返回当前日期(格式为YYYYMMDD),例如20031025

(6)dayofmonth· 参数: 直接忽略掉后边的参数· 支持值类型: 所有(any)· 描述: 返回当前是本月第几天(数值范围:1-31),该函数从Zabbix1.8.5起开始支持(7)dayofweek

· 参数: 直接忽略掉后边的参数· 支持值类型: 所有(any)· 描述: 返回当前是本周的第几天(数值返回:1-7),星期一是1,星期天是7(8)delta· 参数: 秒或#num· 支持值类型:float,int

· 描述: 返回指定时间间隔内的最大值与最小值的差值(max()-min())时间间隔作为第一个参数可以是秒或者收集值的数目从Zabbix1.8.2开始,支持可选的第二个参数time_shift.(9)diff

· 参数: 忽略· 支持值类型:float,int, str,text,log· 描述: 返回值为1表示最近的值与之前的值不同,0为其他情况(10)fuzzytime· 参数: 秒· 支持值类型:float,int

· 描述: 返回值为1表示监控项值的时间戳与ZabbixServer的时间多N秒,0为其他常使用system.localtime来检查本地时间是否与Zabbixserver时间相同.(11)iregexp。

· 参数: 第一个为字符串,第二个为秒或#num· 支持值类型:str,log, text· 描述: 与regexp类似,区别是不区分大小写(12)last· 参数: 秒或#num· 支持值类型:float,int, str,text,log

· 描述: 最近的值,如果为秒,则忽略,#num表示最近第N个值,请注意当前的#num和其他一些函数的#num的意思是不同的例子:last(0) 等价于last(#1)last(#3) 表示最近**第**3个值(并不是最近的三个值)

last(0,86400) 返回一天前的最近的值 (支持第二个参数**time_shift**,如果在history中同一秒中有多个值存在,Zabbix不保证值的精确顺序)(13)logeventid· 参数:string

· 支持值类型:log· 描述: 检查最近的日志条目的EventID是否匹配正则表达式. 参数为正则表达式,POSIX扩展样式. 当返回值为0时表示不匹配,1表示匹配(14)logseverity· 参数: 忽略。

· 支持值类型:log· 描述: 返回最近日志条目的日志等级(logseverity).当返回值为0时表示默认等级,N为具体对应等级(整数,常用于Windowseventlogs).Zabbix日志等级来源于Windowseventlog的Information列.

(15)logsource· 参数:string· 支持值类型:log· 描述: 检查最近的日志条目是否匹配参数的日志来源. 当返回值为0时表示不匹配,1表示匹配通常用于Windows event logs监控. 例如logsource[“VMWare Server”]。

(16)max· 参数: 秒或#num· 支持值类型:float,int· 描述: 返回指定时间间隔的最大值. 时间间隔作为第一个参数可以是秒或收集值的数目(前缀为#).支持第二个可选参数time_shift,可以查看avg()函数获取它的使用方法.

(17)min· 参数: 秒或#num· 支持值类型:float,int· 描述: 返回指定时间间隔的最小值. 时间间隔作为第一个参数可以是秒或收集值的数目(前缀为#).支持第二个可选参数time_shift,可以查看avg()函数获取它的使用方法.

(18)nodata· 参数: 秒· 支持值类型:any· 描述: 当返回值为1表示指定的间隔(间隔不应小于30秒)没有接收到数据,0表示其他.(19)now· 参数: 忽略· 支持值类型:any· 描述: 返回距离Epoch(1970年1月1日00:00:00UTC)时间的秒数

(20)prev· 参数: 忽略· 支持值类型:float,int, str,text,log· 描述:返回之前的值,类似于last(#2)(21)regexp· 参数: 第一个参数为string,第二个参数为秒或#num

· 支持值类型:str,log, text· 描述: 检查最近的值是否匹配正则表达式,参数的正则表达式为POSIX扩展样式,第二个参数为秒数或收集值的数目,将会处理多个值. 本函数区分大小写当返回值为1时表示找到,0为其他.。

(22)str· 参数: 第一个参数为string,第二个参数为秒或#num· 支持值类型:str,log, text· 描述: 查找最近值中的字符串第一个参数指定查找的字符串,大小写敏感第二个可选的参数指定秒数或收集值的数目,将会处理多个值。

当返回值为1时表示找到,0为其他.(23)strlen· 参数: 秒或#num· 支持值类型:str,log, text· 描述: 指定最近值的字符串长度(并非字节), 参数值类似于last函数. 例如strlen(0)等价于strlen(#1),strlen(#3)表示最近的第三个值, strlen(0,86400)表示一天前的最近的值.

(24)sum· 参数: 秒或#num· 支持值类型:float,int· 描述: 返回指定时间间隔中收集到的值的总和. 时间间隔作为第一个参数支持秒或收集值的数目(以#开始). 支持time_shift作为第二个参数。

可以查看avg函数获取它的用法(25)time· 参数: 忽略· 支持值类型:any· 描述: 返回当前时间,格式为HHMMSS,例如123055

说明:以上三个图都是触发器的所有表达式,N代表数值或秒数4、触发器实例触发器的表达式Expression:1{:.()}。

(1)例子一:zabbix.ewin.com上的处理器负载太高{zabbix.ewin.com:system.cpu.load[all,avg1].last(0)}>5它指定服务器是www.zabbix.com,被监控关键字是system.cpu.load[all,avg1],

通过使用函数last(),我们指定最近的值最后,>5表示来自zabbix.ewin.com的最后负载测量大于5则触发器进入PROBLEM状态(2)例子二:zabbix.ewin.com过载了{zabbix.ewin.com:system.cpu.load[all,avg1].last(0)}>5|{zabbix.ewin.com:system.cpu.load[all,avg1].min(10m)}>2。

无论当前处理器负载大于5还是最近10分钟的负载大于2,该表达式的值都是真(3)例子三:文件/etc/passwd被更改了{zabbix.ewin.com:vfs.file.cksum[/etc/passwd].diff(0)}>0

当文件/etc/passwd之前的checksum值于最近的值不同,则该表达式为真(4)例子四:有人从因特网上下载大文件{zabbix.ewin.com:net.if.in[eth0,bytes].min(5m)}>100K

当最近5分钟内,eth0接收的字节数大于100KB,则该表达式为真(5)例子五:两个SMTP服务器的集群节点都停止了注意在一个表达式中使用两个不同的主机{smtp1.ewin.com:net.tcp.service[smtp].last(0)}=0&{smtp2.ewin.com:net.tcp.service[smtp].last(0)}=0。

当SMTP服务器smtp1与smtp2的服务smtp都停止时,表达式为真(6)例子六:zabbix客户端代理需要更新{zabbix.ewin.com:agent.version.str(“beta8”)}=1

当zabbix客户端代理有版本beta8时该表达式为真(7)例子七:服务器不可达{zabbix.ewin.com:icmpping.count(30m,0)}>5主机zabbix.ewin.com在最近30分钟内超过5次不可达该表达式为真。

(8)例子八:最近三分钟内没有回应{zabbix.ewin.com:tick.nodata(3m)}=1tick必须使用类型Zabbix trapper为了这个触发器工作,tick必须定义该主机应该使用。

zabbix_sender定期为该参数发送数据如果180秒都没有收到数据,该触发器的值变为PROBLEM(9)例子九:CPU在夜间活度{zabbix.ewin.com:system.cpu.load[all,avg1].min(5m)}>2&{zabbix.ewin.com:system.cpu.load[all,avg1].time(0)}>000000&{zabbix.ewin.com:system.cpu.load[all,avg1].time(0)}<060000。

触发器只在晚上(00:00-06:00)为可用(10)例子十:检查客户端本地时间是否与zabbix服务器时间同步{MySQL_DB:system.localtime.fuzzytime(10)}=0当MySQL_DB的本地时间与zabbix server的时间相差超过10秒,触发器变为PROBLEM状

态(10)例子十一:服务器房间温度过高滞留:  有时候触发器必须在不同情况下有不同条件例如:我们想定义当服务器房间的温度超过20摄氏度时触发器变为PROBLEM状态,然后触发器一直停留在这个状态除非温度低于15摄氏度。

({TRIGGER.VALUE}=0&{server:temp.last(0)}>20)|({TRIGGER.VALUE}=1&{server:temp.last(0)}>15)注意使用了一个宏{TRIGGER.VALUE},这个宏返回当前触发器的值

退出移动版