温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

Nagios+Cacti模块——NRPE监控linux本地信息(五)

发布时间:2020-07-30 11:57:06 来源:网络 阅读:1510 作者:悠悠子濛 栏目:移动开发

遇到问题:nagios监控远程主机linux的本地信息:如内存,cpu,负载等

解决问题:NRPE监控信息

承接http://mengsir.blog.51cto.com/2992083/1254272 Nagios+Cacti模块——NRPE监控linux本地信息(四)

被监控机:

1.修改nrpe.cfg

vi/var/www/html/nagios/etc/nrpe.cfg      (这里假设1.2.3.4是监控服务器的ip地址)

allowed_hosts=127.0.0.1,1.2.3.4      //允许监控服务器访问,中间用逗号隔开。
server_address=1.2.3.4          // 以单独的守护进程运行

监控主机(nagios主机)

1.配置文件vi /var/www/html/nagios/etc/objects/commands.cfg末尾增加如下内容

define command
        command_name    check_nrpe
        command_line    $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
        }

意义如下:

command_name  check_nrpe

定义命令名称为check_nrpe,在 services.cfg中要使用这个名称

command_line  $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

这是定义实际运行的插件程序.这个命令行的书写要完全按照check_nrpe这个命令的用法.不知道用法的就用check_nrpe –h查看

2.在services.cfg中添加(/var/www/html/nagios/etc/object/services.cfg)

define service {
        host_name               test244-server
       service_description        check-load
        check_command           check_nrpe!check_load
        check_period            24x7
        max_check_attempts      3
        normal_check_interval   3
        retry_check_interval    2
        contact_groups          deyougroup
        notification_interval   10
        notification_period     24x7
        notification_options    w,u,c,r
}

3.手动在nrpe.cfg中添加,也就是自定义NRPE命令.

现在我们要监控swap分区,如果空闲空间小于20%则为警告状态—warning;如果小于10%则为严重状态—critical.我们可以查得需要使用check_swap插件,完整的命令行应该是下面这样.

/usr/local/nagios/libexec/check_swap -w 20% -c 10%

4.在被监控机上增加check_swap命令的定义

vi /var/www/html/nagios/etc/nrpe.cfg

增加下面这一行

command[check_swap]=/var/www/html/nagios/libexec/check_swap -w 20% -c 10%

现在check_swap 就可以作为check_nrpe 的 –c 的参数使用了。

修改了配置文件,当然要重启.但是如果你是以独立的daemon运行的nrpe,那么需要手动重启.如果你是在xinetd或者inetd下面运行的,则不需要.

由于我们是xinetd下运行的,所以不需要重启服务

5.有关于check_load的用法及意义

这个插件是用来检测系统当前的cpu负载,使用的方法为

check_load [-r] -w WLOAD1,WLOAD5,WLOAD15 -cCLOAD1,CLOAD5,CLOAD15

在unix里面负载的均值通常表示是1分钟,5分钟,15分钟内平均有多少进处于等待状态.

例如check_load -w 15,10,5 -c 30,25,20这个命令的意义如下

当1分钟多于15个进程等待,5分钟多于10个,15分钟多于5个则为warning状态当1分钟多于30个进程等待,5分钟多于25个,15分钟多于20个则为critical状态


向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI