本篇内容介绍了“如何配置spark sql查询hive”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
配置idea spark sql连接hive
1.首先将/etc/hive/conf/的hive-site.xml复制到项目的resources下
2.添加maven依赖到pom.xml文件,不仅需要添加spark-sql,还需要添加spark-hive,spark版本2.2.0,scala版本2.10
<!-- https://mvnrepository.com/artifact/org.apache.spark/spark-sql -->
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-sql_2.10</artifactId>
<version>2.2.0</version>
</dependency>
<!-- https://mvnrepository.com/artifact/org.apache.spark/spark-hive -->
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-hive_2.10</artifactId>
<version>2.2.0</version>
</dependency>
3.在程序里设置
val spark = SparkSession
.builder()
.appName("test_note")
.master("local")
.enableHiveSupport()//设置支持hive
.getOrCreate()
到这本地就可以直接查询服务器的hive数据了
配置CDH集群
集群配置只需要将/etc/hive/conf/目录下的hive-site.xml复制到/etc/spark2/conf/目录下,就可以spark-submit了。
“如何配置spark sql查询hive”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。