在MapReduce中shuffle和Spark的shuffle的过程有一些区别。这里做一下具体的介绍。
Mapreduce的shuffle过程图解
Spark shuffle过程图解
注意:spark shuffle过程中没有分区和排序的过程,而且存储结果存储在内存中,所以速度要比mapreduce要快很多。
先就到这里吧,图解的说明应该比较清晰了。有问题欢迎留言
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。