Nagios+Cacti模块——NRPE监控linux本地信息（五）

发布时间：2020-07-30 11:57:06 阅读：1512 作者：悠悠子濛栏目：移动开发

遇到问题：nagios监控远程主机linux的本地信息：如内存，cpu，负载等

解决问题：NRPE监控信息

承接http://mengsir.blog.51cto.com/2992083/1254272 Nagios+Cacti模块——NRPE监控linux本地信息（四）

被监控机：

1.修改nrpe.cfg

vi/var/www/html/nagios/etc/nrpe.cfg （这里假设1.2.3.4是监控服务器的ip地址）

allowed_hosts=127.0.0.1,1.2.3.4      //允许监控服务器访问，中间用逗号隔开。
server_address=1.2.3.4          // 以单独的守护进程运行

监控主机（nagios主机）

1.配置文件vi /var/www/html/nagios/etc/objects/commands.cfg末尾增加如下内容

define command
        command_name    check_nrpe
        command_line    $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
        }

意义如下：

command_name check_nrpe

定义命令名称为check_nrpe，在 services.cfg中要使用这个名称

command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$

这是定义实际运行的插件程序.这个命令行的书写要完全按照check_nrpe这个命令的用法.不知道用法的就用check_nrpe –h查看

2.在services.cfg中添加（/var/www/html/nagios/etc/object/services.cfg）

define service {
        host_name               test244-server
       service_description        check-load
        check_command           check_nrpe!check_load
        check_period            24x7
        max_check_attempts      3
        normal_check_interval   3
        retry_check_interval    2
        contact_groups          deyougroup
        notification_interval   10
        notification_period     24x7
        notification_options    w,u,c,r
}

3.手动在nrpe.cfg中添加,也就是自定义NRPE命令.

现在我们要监控swap分区,如果空闲空间小于20%则为警告状态—warning;如果小于10%则为严重状态—critical.我们可以查得需要使用check_swap插件,完整的命令行应该是下面这样.

/usr/local/nagios/libexec/check_swap -w 20% -c 10%

4.在被监控机上增加check_swap命令的定义

vi /var/www/html/nagios/etc/nrpe.cfg

增加下面这一行

command[check_swap]=/var/www/html/nagios/libexec/check_swap -w 20% -c 10%

现在check_swap 就可以作为check_nrpe 的 –c 的参数使用了。

修改了配置文件,当然要重启.但是如果你是以独立的daemon运行的nrpe,那么需要手动重启.如果你是在xinetd或者inetd下面运行的,则不需要.

由于我们是xinetd下运行的,所以不需要重启服务

5.有关于check_load的用法及意义

这个插件是用来检测系统当前的cpu负载,使用的方法为

check_load [-r] -w WLOAD1,WLOAD5,WLOAD15 -cCLOAD1,CLOAD5,CLOAD15

在unix里面负载的均值通常表示是1分钟,5分钟,15分钟内平均有多少进处于等待状态.

例如check_load -w 15,10,5 -c 30,25,20这个命令的意义如下

当1分钟多于15个进程等待,5分钟多于10个,15分钟多于5个则为warning状态当1分钟多于30个进程等待,5分钟多于25个,15分钟多于20个则为critical状态

向AI问一下细节

Nagios+Cacti模块——NRPE监控linux本地信息（五）

猜你喜欢

最新资讯

相关推荐

相关标签