这篇文章主要介绍了hive中的mapjoin怎么用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。遇到一个hive的问题,如下hive
一、map join 1、适用场景:一张表很大,一张表很小 2、解决方案:在map端缓存多张表,提前处理业务逻辑,这样增加map端业务,减少reduce端的数据压力,尽可能减少数据倾斜。 3、具体方法