WebLogic Server 在 Debian 上的故障排查可以通过以下步骤进行:
环境及问题现象
- 环境说明:
- WebLogic 版本:Oracle WebLogic 12.2
- WebLogic 架构:6 节点集群。
- Redis:5.x.x;使用三主三从的 Redis 集群。
- JDK 版本:JDK-1.8.0_x
- 操作系统:Debian(具体版本未提及)
- 操作系统资源:8 core CPU,24GB 内存,200GB 磁盘。
- 问题描述:
- 当系统发生故障时,系统资源使用过高,包括 CPU、内存等。
- Redis 也有相关的报错。
- 系统运行需要调用的另外一个系统也有故障发生(依赖关系)。
- WebLogic 日志也有应用代码相关的报错以及其他资源类不足报错。
问题排查
- 系统资源使用分析:
-
内存分析:
- 使用
top
和 free
命令查看内存使用情况。
- 如果
free
的值很低,但 swap
中的 used
信息没有大幅度增加或波动,说明内存基本够用。
- 使用
sar -r
命令进一步确认内存使用情况。
-
CPU 分析:
- 观察操作系统上 CPU 的使用情况。
- 查看 WebLogic 线程 dump 信息,分析活动线程的状态和运行情况。
-
I/O 情况分析:
- 检查 I/O 使用情况,确认是否有 I/O 压力。
- WebLogic 诊断:
-
Admin 控制台卡顿问题:
- 检查 Admin 控制台是否卡顿,可能是由于 OS CPU 使用率过高或被管节点繁忙造成的。
-
被管节点自动 shutdown 然后重启问题:
- 检查集群里的被管节点是否无规律地出现问题,开始状态。
常见的 WebLogic 报错及解决方法
-
管理节点报错:
- 通过
nohup ./startweblogic.sh &
命令启动管理节点后,使用 tail -f nohup.out
查看日志,查找报错信息。
- 例如,
bea-000386
报错可能与网络配置错误有关。
故障排查工具
- 使用
weblogic-infodetector
插件探测 T3 协议及版本信息。
- 使用
superman
或其他工具进行进一步的漏洞探测和攻击。
在进行故障排查时,建议按照以下步骤进行:
- 收集信息:收集系统日志、WebLogic 日志、操作系统日志等相关信息。
- 分析问题:根据收集到的信息,分析问题的可能原因。
- 制定排查计划:根据分析结果,制定详细的排查计划,逐步缩小问题范围。
- 执行排查:按照排查计划,逐一排查可能的问题点。
- 验证解决方案:实施解决方案后,验证问题是否解决。
- 总结经验:总结故障排查过程中的经验教训,以便后续参考。
请注意,以上信息仅供参考,具体的故障排查步骤可能会因环境差异而有所不同。在进行故障排查时,请根据实际情况进行调整。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>