本篇内容介绍了“Hadoop怎么搭建本地模式”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
本地模式是最简单的模式,所有模块都运行在一个JVM
进程中,使用本地文件系统而不是HDFS
。
本地模式主要是用于本地开发过程中的运行调试用,下载后的Hadoop
不需要设置默认就是本地模式。
笔者喜欢把JDK
放在/usr/local
下,运行前请确保设置了JAVA_HOME
,注意是在etc/hadoop/hadoop-env.sh
中设置:
tar -zxvf openjdk-11+28_linux-x64_bin.tar.gz sudo mv openjdk-11+28_linux-x64_bin /usr/local/java sudo vim HADOOP/etc/hadoop/hadoop-env.sh # HADOOP为Hadoop安装目录 # 输入 export JAVA_HOME=/usr/local/java
官网关于该模式没有太多的描述,只有一个使用默认配置文件作为输入,然后匹配正则表达式作为输出的简单例子:
# HADOOP表示Hadoop安装目录 mkdir input cp HADOOP/etc/hadoop/*.xml input HADOOP/bin/hadoop jar HADOOP/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.0.jar grep input output 'dfs[a-z.]+' cat output/*
从下图的id
可以看出是以本地模式工作的:
输出文件夹output
有两个文件:
_SUCCESS
:是个空文件,表示运行成功
part-r-00000
:输出结果文件,词数统计
part-r-00000
结果如上图所示。
实际上本地模式不需要特别的处理,因为默认就是本地模式。
“Hadoop怎么搭建本地模式”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。