温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

map分片大小要与块大小相同吗

发布时间:2021-12-30 09:31:24 来源:亿速云 阅读:150 作者:iii 栏目:云计算

这篇文章主要讲解了“map分片大小要与块大小相同吗”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“map分片大小要与块大小相同吗”吧!

所有的省时间优化,主要是讲Hadoop采用的数据本地优化,避免浪费宝贵的网络带宽,但是有时候对于一个Map任务输入来说,储存有某个HDFS数据块备份的三个节点可能正在运行其他map任务,此时作业调度,也就是所谓的JobTracker需在三个备份中的某个数据寻求同个机架中的空闲机器来运行该map任务。

map分片大小要与块大小相同吗

所以我们应该清楚了为什么最佳分片大小应该与块大小相同:因为这种机制可以确保可以储存在单个节点上的最大输入块的大小。换句话说加重的字体是我们的目标。如果分片跨越两个数据块,那么对于任何一个HDFS节点,基本上都不可能同时储存这两个数据块,因此分片中的部分数据需要通过网络传输到map任务节点,与使用本地数据运行整个map任务相比,这种方法显然效率更低。

此外,应该注意map任务应该将结果存入本地硬盘,而不是HDFS系统。因为它产生的只是中间结果。

感谢各位的阅读,以上就是“map分片大小要与块大小相同吗”的内容了,经过本文的学习后,相信大家对map分片大小要与块大小相同吗这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

map
AI