小生博客: http://xsboke.blog.51cto.com/
如果有疑问, 请点击此处 http://blog.51cto.com/xsboke/2327219 , 然后发表评论交流, 作者会及时回复, 也可直接在本文章评论.
------- 谢谢您的参考, 如有疑问, 欢迎交流
目录
各种 zabbix 角色的配置文件
zabbix 配置项之 Items
zabbix 配置项之 Graphs
zabbix 配置项之 Screens
zabbix 配置项之 Trigger
zabbix 配置项之 Action
zabbix 配置项之 Event
zabbix 配置项之 Media Type
一, 各种 zabbix 角色的配置文件
> Server 的配置文件为 zabbix_server.conf, 至少应该为其配置数据库等有关信息;
> Agent 的配置文件为 zabbix_agentd.conf, 至少应该为其指定 server 的 IP 地址
> Proxy 的配置文件为 zabbix_proxy.conf, 至少应该为其指定 proxy 的主机名和 server 的 IP, 以及数据库相关信息
> Application: 多个 item 组成一个 application
二, zabbix 配置项之 Items
> Name: 监控项的名字
> Type:item 的类型, 使用哪种方式采集数据
> Key: 采集数据时的表达式, key 是用来标记 item 的键, 也称为标示符, 用来标示唯一的指标, 可以接受一个或多个参数
> Type of information: 采集的数据类型格式
> Data type: 对于 type of information 的数据类型
> Units: 单位
> Use custom multiplier: 乘多少倍, 比如 zabbix 默认单位是 k, 但是 Linux 的内存为 kb, 那么这里你需要输入 1024
> Update interval(in sec): 多长时间采集一次
> Flexible intervals: 自定义列表
> New flexible interval: 自定义只在什么时候采集
> Keep history: 数据历史保存多少天
> Keep trends: 趋势数据保存多少天
> Store value: 保存类型: as is, 采集的时候什么样, 保存的时候就什么样; delta(speed per second), 当前时间点的值减去上个时间点的值, 并除以两个时间点之间的时间; delta(simple change), 只记录差值
> Show value: 显示什么样
> New Application: 放到哪个 application 里面, 比如监控网卡信息的 item 全部放在 net 的 application 里面
> Description: 描述 item
三, zabbix 配置项之 Graphs
> Name: 图的名字
> Width/height: 宽和高
> Graph type: 图像类型; normal 正常图, stacked 堆叠图, pie 饼图, exploded 分裂饼图
> Show legend: 显示纵轴横轴
> Show working time:
> Show triggers: 显示触发器
- > Percentile line(left):
- > Percentile line(right)
> Y axis MIN value:Y 轴的最小值, 刻度, calculated(自动变化),fixed(固定)
> Y axis MAX value:Y 轴的最大值, 刻度, calculated(自动变化),fixed(固定)
> Items: 要组合在一起的监控图像; function(avg 平均值, min 最小值, max 最大值);Draw styple 图形类型(line 默认线, bold line 加粗的线, dot 点虚线, dashed line 各个横杠组成的线);Y axis side(Y 轴的显示位置)
四, zabbix 配置项之 Screens
> Name: 名字
- > Columns(列)
- > Rows(行)
> 创建完之后返回上一层点击 screens 然后点击 changes 添加 graph 图
五, zabbix 配置项之 Trigger
> 触发器主要目的是定义域值, 超出域值则状态为 "problem", 恢复后转换回 "OK"
> 触发器表达式高度灵活, 可以创建出非常复杂的测试条件
> 创建触发器:
1) Name: 触发器的名称, 可以使用宏. 如 $1/$2.. 等
2) Expression: 填写触发器表达式, 用于评估触发器状态
3) Multiple problem events generation: 依赖于当前触发器的 "problem" 状态生成其他事件
4) Description: 当前触发器的描述信息
5) Url: 在 screen 的 "status of trigger" 中显示的内容链接
6) Severity: 当前触发器的严重级别
7) Dependencies: 依赖关系, 比如监控机和被监控机中间有一台路由器, 路由器挂了, 于是主机也连不上了, 然后所有主机都会报警, 但被监控主机并没有挂掉, zabbix 只支持触发器之间的依赖关系, 不能定义主机和主机之间的(nagios 可以).
> 基本的触发器表达式格式如下:
{<server>:<key>.<function>(<parameter>)}<operator><constant>
1) Server: 主机名称
2) Key: 主机上关系的相应监控项的 key
3) Function: 评估采集到的数据是否在合理范围内时所使用的函数, 目前所支持的函数有 avg(平均),count(计数),change(改变的值的大小, 如; 上一次是 50 这一次是 30, 改变的大小就是 20),date(时间),dayofweek(星期),delta(二者差值),diff(不同之处),iregexp(与正则表达式做匹配),last(最后一次采样),max(最大值),min(最小值),nodata(没有采到值),now(当前的值),sum(求和)等
4) Parameter: 函数参数大多数数值函数可以接收秒数为其参数, 而如果在数值参数之前使用 "#" 号作为前缀, 则表示最近几次的值, 如 sum(300)表示 300 秒内所有取值之和, 而 num(#10)则表示最近 10 次的取值之和
5) 此外, avg,count,last,min 和 max 还支持使用第二个参数, 用于完成时间限定; 例如, max(1h,7d)将返回一周之前的最大值
6) Operator: 表达式;/(除),*(乘),-(减),+(加),<(小于),>(大于),#(不等于),=(等于),&(逻辑与),|(逻辑或)
7) Constant: 常数
> 一个例子:
{www.baidu.com:system.CPU.load[all,avg1].last(0)}>3
1) 表示主机 www.baidu.com 上所有的 CPU, 在过去 1 分钟内的平均负载的最后一次取值大于 3 时, 将触发状态转换
2) 对于 last 函数来说, last(0)相当于 last(#)
六, zabbix 配置项之 Action
> 在配置好监控项和触发器之后, 一旦正常工作中的某触发器状态发生改变, 一般意味着有异常情况发生, 此时通常需要采取一定的动作(action), 如告警或者执行远程命令等
> 并非所有的触发器状态发生改变的场景都需要对其进行干预, 如状态转变为 "OK" 时, 相应的, 如果触发器的状态转变为 problem, 就需要告知所有关系其相关监控指标的人员了, 通知 "notification" 是 zabbix 中最常用的动作之一
> 实现 zabbix 的通知功能需要两个步骤:
1) 定义所需媒介 "media", 通常指发送消息的途径, 如邮箱等等.
2) 配置一个动作 "action": 发送信息至某 "媒介"
3) 动作由 "条件" 和 "操作" 组成, 他的逻辑为当 "条件" 满足时, 就执行相应操作, 操作可以使 "发送通知" 也可以是 "执行远程命令"
> 定义 action
1) Name: 动作的名称
2) Default operation step duration: 步长; 在故障没有解决之前, 每隔多久就发一次通知
3) Default subject: 邮件主题(宏)
4) Default message: 报警信息(宏)
5) Recovery message: 恢复后的操作
6) Conditions: 条件, 在上面条件下触发 operations, 一般都要排除 "maintenance" 维护中的主机
7) Operation: 操作, 条件满足后, 触发操作, action operation: 已经配置好的操作; operation details: 配置操作区域; operation type: 发送消息, 或者执行远程命令; from to: 指定从第几步到第几步
七, zabbix 配置项之 Event
> 触发器 (trigger) 事件: 每次触发器的状态发生变化, 都会生成相应的事件
> 发现 (discovery) 事件: zabbix 会周期性的扫描 "网络发现规则" 中指定的 IP 范围, 一旦发现主机或服务, 就会生成一个或几个发现事件; 发现事件有 8 类: service up 服务启动, service down 服务器停止, host up 主机上线, host dowm 服务上线, service discovery 服务发现, service lost 服务找不到了, host discovery 发现主机和 host lost 失去主机
八, zabbix 配置项之 Media Type
> 在 zabbix 中, 媒介指发送通知信息的通道, 其通常有一下几种类型
1) Email,SMS,Jabber, 自定义的通知脚本(zabbix server 可调用其配置文件 "AlertScriptsPath" 变量, 所定义的脚本查找目录中的脚本来完成通知)
来源: http://www.bubuko.com/infodetail-2932027.html