问题1:1部windows服务器,安装了Zabbix Agent, 然后不断重复报警
High ICMP ping loss
Zabbix agent on xxx is unreachable for 5 minutes
解决方法:修改为主动侦测
打开:C:\Program Files\Zabbix Agent\zabbix_agentd.conf
激活ServerActive, 把Zabbix监控服务器填写好,让被监控主机主动提交信息。
关于这个主动监控,端口应该为10051才对,ServerActive=zabbix_server_ip:10051
可通过这个命令检查log:sudo tail -f /var/log/zabbix-agent/zabbix_agentd.log
如果存在连通性问题,log会提示错误信息如下:
123705:20191106:074310.500 agent #0 started [main process]
123706:20191106:074310.500 agent #1 started [collector]
123710:20191106:074310.502 agent #5 started [active checks #1]
123707:20191106:074310.502 agent #2 started [listener #1]
123709:20191106:074310.502 agent #4 started [listener #3]
123708:20191106:074310.503 agent #3 started [listener #2]
123710:20191106:074313.502 active check configuration update from [54.222.165.90:10050] started to fail (cannot connect to [[54.222.165.90]:10050]: [4] Interrupted system call)
这里的10050端口错误,需要修改为10051,同时zabbix server那边的网络需要打开允许client agent IP 访问10051端口
设置成功后,正常的log内容如下:
140859:20191106:082004.516 using configuration file: /etc/zabbix/zabbix_agentd.conf
140859:20191106:082004.516 agent #0 started [main process]
140860:20191106:082004.516 agent #1 started [collector]
140863:20191106:082004.517 agent #4 started [listener #3]
140861:20191106:082004.518 agent #2 started [listener #1]
140862:20191106:082004.518 agent #3 started [listener #2]
140864:20191106:082004.518 agent #5 started [active checks #1]
还有一种方法将trigger由5分钟修改为长一点的时间,例如10分钟
问题2:在Zabbix服务器页面端提示 get value from agent failed: cannot connect to IP:10050, interrupted system call
解决方法1:客户端开启10050端口访问(防火墙端)
如何从服务器端检测联通性,如下在Zabbix服务器端操作:
sudo apt install zabbix-get
然后输入命令:zabbix_get -s client_ip -p 10050 -k "system.uptime"
通的话会返回一串数字
解决方法2:客户端发起主动传输给服务端
vim /etc/zabbix/zabbix_agentd.conf
Windows:C:\Program Files\Zabbix Agent\zabbix_agentd.conf
下面这一行填写服务器IP
ServerActive=zabbix_server_ip:10050
然后重启agent:sudo service zabbix-agent restart
问题 3:Too many processes on host
Zabbix的Linux Template默认300进程,超过就会报警
解决方法:禁用或者调高这个默认的300阀值
问题4:防火墙已开启但是仍然无法连接Zabbix Agent
从Zabbix服务器端:zabbix_get -s IP -p 10050 -k "system.uptime"
提示如下错误:
zabbix_get [21359]: Check access restrictions in Zabbix agent configuration
然后Zabbix Server网页端,添加host后,显示红色,鼠标点上提示信息:Received empty response from Zabbix Agent at [IP]. Assuming that agent dropped connection because of access permissions.
而在Agent端检查log:没有任何错误提示
尝试检查防火墙和zabbix_agent.conf文件配置,IP什么的都没有问题
后来尝试卸载zabbix agent然后重新安装:
sudo apt-get remove zabbix-agent
sudo apt-get remove --auto-remove zabbix-agent
sudo apt-get purge zabbix-agent
安装
sudo apt-get install zabbix-agent
这个过程实际上把新版的zabbix agent装上了,原来我装的是旧版
然后才重新配置好conf文件并重启zabbix agent服务,然后打开log文件,新版log文件位置也改了/var/log/zabbix/, 旧版为/var/log/zabbix_agent/,终于发现错误
这才明白这个防火墙与服务器之间是通过端口转发实现的,需要将zabbix_agent.conf的server IP修改为这个192.168.150.6才可以,原来一直设的是公网IP。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。