本文只是介绍apache hadoop完全分布式的最简化部署配置 没有对性能进行优化
实际生产环境hadoop的调优参数有几十个
Hadoop的框架最核心组成结构就是:HDFS和MapReduce。
HDFS是海量数据的分布式存储方案
MapReduce为海量的数据提供了计算
centos 7 3台或者4台 如果需要secondarynamenode的情况
分别是namenode datanode0 datanode1 secondarynamenode暂时不配置
配置etc/hadoop/mapred-site.xml
指定mapreduce框架
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
配置etc/hadoop/slave文件,将datanode添加进去,本文环境就是datanode0和datanode1
从namenode将hadoop的目录复制到其他节点,包括所有的binary,脚本,配置文件,默认其他节点的目录位置和结构与namenode一致
格式化hdfs
hdfs namenode -format
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。