这篇文章主要讲解了“用Partition函数怎么实现Hive动态分区”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“用Partition函数怎么实现Hive动态分区”吧!
一、前段时间因为导表需求(从一张表中查找出数据,按日期分区overwrite 到指定分区表中),在Hive里面研究了一下自动分区。
步骤:
1、建好所需分区表
2、设置分区参数
set hive.exec.dynamic.partition=true;(可通过这个语句查看:set hive.exec.dynamic.partition;) set hive.exec.dynamic.partition.mode=nonstrict; SET hive.exec.max.dynamic.partitions=100000;(如果自动分区数大于这个参数,将会报错) SET hive.exec.max.dynamic.partitions.pernode=100000;
3、书写代码(特别注意:日期字段一定要放在末尾),例如:
INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt) select id ,... ,pv ,0 uv ,cal_dt from dw_stage.tiny_info_msg
二、如果要在partition字段用函数处理也可通过通过这种方式实现;例如:
set hive.exec.dynamic.partition=true; set hive.exec.dynamic.partition.mode=nostrick; INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt) SELECT id ,... ,pv ,date_sub('2014-03-23',7) cal_dt FROM dw_stage.tiny_info_msg07;
感谢各位的阅读,以上就是“用Partition函数怎么实现Hive动态分区”的内容了,经过本文的学习后,相信大家对用Partition函数怎么实现Hive动态分区这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。