在Debian系统中查看Hadoop日志,通常需要通过Hadoop的日志聚合功能来实现。Hadoop的日志聚合功能会将各个节点的日志收集到中央存储(通常是HDFS)中,从而实现日志的集中化管理。以下是查看Debian Hadoop日志的步骤:
首先,确保在Hadoop集群的所有节点上启用了日志聚合功能。这通常在yarn-site.xml
配置文件中设置:
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>
<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>172800</value>
</property>
<property>
<name>yarn.nodemanager.remote-app-log-dir</name>
<value>/tmp/logs</value>
</property>
<property>
<name>yarn.nodemanager.remote-app-log-dir-suffix</name>
<value>logs</value>
</property>
<property>
<name>yarn.log.server.url</name>
<value>http://hadoop-node0:19888/jobhistory/logs</value>
</property>
日志聚合后,可以通过Hadoop的ResourceManager Web UI或Job History Server Web UI来查看日志。
http://<ResourceManager-hostname>:8088/cluster/apps/FINISHED
。http://<JobHistory-Server-hostname>:19888/jobhistory
。如果需要直接从HDFS查看日志,可以使用hdfs dfs
命令:
hdfs dfs -cat /path/to/logs/*
可以使用任何文本编辑器(如nano
、vim
等)打开并查看日志文件:
sudo nano /path/to/logs/application-<application-id>-container-<container-id>.log
请注意,具体的日志文件路径和URL可能会根据你的Hadoop集群配置有所不同。建议查阅你的Hadoop集群配置文件以获取准确的日志路径。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
推荐阅读:Debian Hadoop 日志分析技巧