Spark是什么

发布时间：2021-12-16 10:50:45 阅读：199 作者：iii 栏目：云计算

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

本篇内容介绍了“Spark是什么”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

一、到底什么是Spark？

Spark是什么

Spark是一个通用的大数据计算平台，基于“One Stack to rule them all”的理念成功成为了一体化多元化的大数据处理平台，轻松应对大数据处理中的实时流计算、SQL交互式查询、机器学习和图计算等：

Spark是什么

Spark源于BDAS:

Spark是什么

基于该技术堆栈，Spark目前已经成为大数据通用计算平台：

Spark是什么

二， Spark的速度为何如此之快？

首先我们看一下Hadoop经典的处理过程：

Spark是什么

MapReduce在每次执行的时候都要从磁盘读数据，计算完毕后都要把数据存放到磁盘上：

Spark是什么

而Spark是基于内存的：

Spark是什么

另外一方面，DAG也是Spark快的极为重要的原因，下面是一张DAG图的示例：

Spark是什么

大家也可以看一下网络上一张描述DAG更多细节的图片：

Spark是什么

基于DAG，Spark具备了非常精致的作业调度系统：

Spark是什么

DAG中的依赖有宽依赖和窄依赖之分：

Spark是什么

在DAG图中可以根据依赖对pipeline等优化操作：

Spark是什么

基于RDD和DAG，并行计算整个Job：

Spark是什么

“Spark是什么”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站，小编将为大家输出更多高质量的实用文章！

向AI问一下细节

猜你喜欢