阅读背景:

Spark学习笔记:三、RDD原理

来源:互联网 

一、RDD原理:

一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合,每个RDD可以分成多个分区,每个分区就是一个数据集片段,并且一个RDD的不同分区可以被保存到集群中不同的节点上,从而可以在集群中的不同节点上进行并行计算。一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: