温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

如何利用HDFS来解决Spark On Yarn模式解决Jar乱飞情况

发布时间:2021-07-10 11:40:54 来源:亿速云 阅读:250 作者:chen 栏目:编程语言

本篇内容主要讲解“如何利用HDFS来解决Spark On Yarn模式解决Jar乱飞情况”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何利用HDFS来解决Spark On Yarn模式解决Jar乱飞情况”吧!

Spark的jar包比较多,如果直接修改spark的jars目录中的jar可能对用户造成jar包冲突,也不利于管理,因为可以利用HDFS存储功能解决jar问题

1、在本地创建zip文件,压缩jar包

# 进入到spark的jars目录,在spark的jars目录下压缩包
zip spark.zip ./*

2、HDFS上创建存放spark jar目录

hdfs dfs -mkdir -p /spark-yarn/jars

3、将$SPARK_HOME/jars下的spark.zip包上传至刚健的HDFS路径

[hadoop@hadoop jars]$  hdfs dfs -put ./spark.zip /spark-yarn/jars/

4、在spark-defaults.conf中添加(也可以在启动时候 -conf 指定)

spark.yarn.archive hdfs://ruozedata001:9000/spark-jars/spark.zip

5、查看Spark log

yarn log -applicationID xxx

https://www.cnblogs.com/chhyan-dream/p/12799856.html

https://blog.csdn.net/naruto00001/article/details/79578520

到此,相信大家对“如何利用HDFS来解决Spark On Yarn模式解决Jar乱飞情况”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI