这篇文章主要讲解了“Spark core的算子怎么获取”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Spark core的算子怎么获取”吧!
转换过滤算子
map : (map flatMap mapPartitions mapPartitionWithIndex)
filter
ByKey算子
分组:groupByKey 排序:sortByKey 统计:countByKey reduce处理:(reduce reduceByKey aggregateByKey)
获取算子
take
takeSample
collect
saveAsTextFile
两个集合算子
交集:intersection
并集:union
笛卡尔积:cartesian
join
cogroup
单独集合处理算子
去重:distinct
统计:count
partition管理算子
压缩:coalesce 重置:repartition
感谢各位的阅读,以上就是“Spark core的算子怎么获取”的内容了,经过本文的学习后,相信大家对Spark core的算子怎么获取这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。
原文链接:https://my.oschina.net/u/947726/blog/740872