taoCMS是基于php+sqlite/mysql的国内最小(100Kb左右)的功能完善、开源免费的CMS管理系统

Nagios监控报警系统(配置)

2012-09-12
以下为server服务器配置文件设计架构

监控服务分类:website网站,j2ee,mysql数据库,其他服务

配置文件关键点:
1. 定义host,定义属于哪个group,可以多个group定义
2. 定义group,不需要定义node内容
3. 系统自带command中的disk,load,等需要修改成监控remote服务器的,默认的只能监控本地。
4. 如果定义了escanlations之后,service中定义的报警时间将无效,将以escanlations作为最后的报警标准
5. 关于escanlations定义,必须是一个host为一个配置项,不能以group来区分

  1. +-- cgi.cfg -- web页面访问权限设置
  2. +-- nagios.cfg -- nagios的主要配置文件,定义其他配置文件的地址,及监控的其他属性
  3. +-- objects
  4.     +-- commands.cfg -- nagios默认的监控指令定义文件
  5.     +-- contacts.cfg -- nagios默认监控的联系人定义文件
  6.     +-- haatalk -- 自定义的server监控服务器定义文件夹
  7.         +-- commands.cfg -- 自定义的部分监控指令存放文件
  8.         +-- contact -- 自定义的部分报警联系人存放文件夹
  9.             +-- contact.cfg
  10.             +-- group.cfg
  11.         +-- escalations -- 自定义报警频率定义文件夹
  12.             +-- j2ee.cfg
  13.             +-- mysql.cfg
  14.             +-- others.cfg
  15.             +-- website.cfg 
  16.         +-- host -- 自定义监控服务器属性的文件夹
  17.             +-- group.cfg -- 自定义的监控服务器组定义的文件,定义中不包含node定义,只是定义组名即可
  18.             +-- hosts_j2ee.cfg -- j2ee服务器的定义文件,定义中包含所属组定义,可以属于多个组
  19.             +-- hosts_mysql.cfg -- mysql服务器的定义文件,定义中包含所属组定义,可以属于多个组
  20.             +-- hosts_others.cfg -- 其他服务器的定义文件,定义中包含所属组定义,可以属于多个组
  21.             +-- hosts_website.cfg -- 网站服务器的定义文件,定义中包含所属组定义,可以属于多个组
  22.         +-- service
  23.             +-- j2ee.cfg -- j2ee服务器组需要监控的服务项目
  24.             +-- media.cfg -- media服务器组需要监控的服务项目
  25.             +-- mysql.cfg -- mysql服务器组需要监控的服务项目
  26.             +-- normal.cfg -- normal服务器组需要监控的服务项目,所有服务器都必须部署这个监控,一般包括内存,硬盘,负载,网络监控
  27.             +-- website.cfg -- 网站服务器组需要监控的服务项目
  28.     +-- localhost.cfg
  29.     +-- printer.cfg
  30.     +-- switch.cfg
  31.     +-- templates.cfg
  32.     +-- timeperiods.cfg -- 系统定义进行监控和报警的时间范围
  33. +-- resource.cfg
host定义实例:
  1. ## website server ## 
  2. define host{
  3.        use linux-server
  4.        host_name website_192.168.0.111
  5.        alias offical website
  6.        address  192.168.0.111
  7.        hostgroups normal,website ##可以属于多个组
  8.        }
group定义:
  1. define hostgroup{
  2.        hostgroup_name normal
  3.        alias normal
  4. }
  5. define hostgroup{
  6.        hostgroup_name website
  7.        alias Offical WebSite
  8. }
service定义:
  1. define service{ 
  2.        use generic-service
  3.        hostgroup_name website
  4.        service_description HTTP
  5.        check_command check_http
  6.        check_interval 2 
  7.        retry_interval 1 
  8.        max_check_attempts 3 
  9.        notification_period workhours 
  10.        notification_interval 2 
  11.        notification_options w,u,c,r, 
  12.        contact_groups admins 
  13.        }
报警频率定义:

  1. ## website_ 192.168.0.111  ##
  2. define serviceescalation{
  3.        host_name website_ 192.168.0.111  #制定一次定义一个host,不能直接定义hostgroup
  4.        service_description PING,Root Partition,Total Processes,Current Load,HTTP
  5.        first_notification 0 
  6.        last_notification 4 
  7.        notification_interval 5
  8.        contact_groups all
  9.        }
  10. # 以上定义前3次报警频率是5分钟
  11. define serviceescalation{
  12.        host_name website_ 192.168.0.111
  13.        service_description PING,Root Partition,Total Processes,Current Load,HTTP
  14.        first_notification 5
  15.        last_notification 0
  16.        notification_interval 60
  17.        contact_groups all
  18.        }
  19. # 以上定义前4次,直到服务回复,报警频率是60分钟,如果服务在中途恢复了,还是有收到recovery的消息

备注:

关于修改默认disk和load监控,可以采用nrpe插件的默认进行监控。
根据我这个架构中,在自定义command文件中添加以下配置:
  1. define command{
  2.         command_name Check_nrpe
  3.         command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -a $ARG2$
  4.         }
本人比较懒惰,最好把监控的参数都放在master上面,如果放在remote上面,一旦修改了监控参数更新就比较麻烦,所有必须保证remote服务器能接受参数传递。
然后修改service中的command定义
load监控:
  1. check_command Check_nrpe!check_load!"5.0,4.0,3.0" "10.0,6.0,4.0"
disk监控(根目录:/):
  1. check_command Check_nrpe!check_disk!"20%" "10%" "/"
然后在被监控的服务器,将nrpe配置修改了即可(配置在我另外一个安装的文档有讲到)

类别:技术文章 | 阅读:196071 | 评论:0 | 标签:nagios 监控

想收藏或者和大家分享这篇好文章→

“Nagios监控报警系统(配置)”共有0条留言

发表评论

姓名:

邮箱:

网址:

验证码:

公告

taoCMS发布taoCMS 3.0.2(最后更新21年03月15日),请大家速速升级,欢迎大家试用和提出您宝贵的意见建议。

捐助与联系

☟请使用新浪微博联系我☟

☟在github上follow我☟

标签云