安装hadoop要点有哪些,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。
1、安装JDK
tar -zxvf jdk-7u75-linux-i586.tar.gz -C /root/training/
vi ~/.bash_profile
JAVA_HOME=/root/training/jdk1.7.0_75
export JAVA_HOME
PATH=$JAVA_HOME/bin:$PATH
export PATH
source ~/.bash_profile
修改这个vi /etc/selinux/config SELINUX=disabled
可以查看环境变量 vi /etc/profile
Hadoop配置环境
vi ~/.bash_profile
HADOOP_HOME=/root/training/hadoop-2.4.1
export HADOOP_HOME
PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export PATH
使环境变量生效:
source ~/.bash_profile
修改 cd training/hadoop-2.4.1/etc/hadoop/hadoop-env.sh
27 #export JAVA_HOME=${JAVA_HOME}
28 export JAVA_HOME=/root/training/jdk1.7.0_75
可以写一个例子进行测试
I love Beijing
I love China
Beijing is the capital of China
运行:hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount ~/data/input/data.txt ~/data/output
安装伪分布模式
<!--数据的冗余度-->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<!--NameNode的地址-->
<!--9000:RPC通信的端口-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://192.168.106.2:9000</value>
</property>
<!--配置数据在dataNode上保存的位置-->
<!---默认:linux的tmp目录-->
<property>
<name>hadoop.tmp.dir</name>
<value>/root/training/hadoop-2.4.1/tmp</value>
</property>
<!--ResourceManager运行的框架-->
<!---洗牌MR运行的方式-->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>192.168.137.111</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
(*) 对HDFS格式化
hdfs namenode -format
启动Hadoop
start-all.sh
-------------免登陆配置------------------
1、产生密钥对
ssh-keygen -t rsa
2、公钥给别人
ssh-copy-id -i .ssh/id_rsa.pub root@192.168.137.111
改名:.ssh/authorized_keys
/root/training/hadoop-2.4.1/etc/hadoop/hadoop-env.sh
可以更改缓存
看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注亿速云行业资讯频道,感谢您对亿速云的支持。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。