温馨提示×

Spark中的RDD是指什么

spark

小樊

113

2024-03-05 17:39:06

栏目: 大数据

开发者测试专用服务器限时活动，0元免费领，库存有限，领完即止！点击查看>>

RDD（Resilient Distributed Dataset）是Spark中最基本的数据抽象，它代表一个不可变、可分区、元素集合。RDD可以并行计算，分布在集群中的多个节点上。RDD可以从Hadoop文件系统、HBase、Cassandra等数据源创建，也可以通过其他RDD的转换操作生成。RDD是Spark提供的一种高容错性的数据结构，即使在节点发生故障时也能够自动恢复。

亿速云「云服务器」，即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘，价格低至29元/月。点击查看>>

0 赞

0 踩

相关标签

产品服务

地区划分

专题活动

帮助支持

关于我们

售后咨询

7*24小时在线电话：400-100-2938

7*24小时在线 QQ：800811969

关注亿速云

亿速云公众号

手机网站二维码

Spark中的RDD是指什么

最新问答

相关标签