RDD特性包含如下哪些？（）A、一组分片（Partition），即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表，存储存取每个Partition的优先位置（preferredlocation）

题目

RDD特性包含如下哪些？（）

A、一组分片（Partition），即数据集的基本组成单位
B、一个计算每个分区的函数
C、RDD之间的依赖关系
D、一个列表，存储存取每个Partition的优先位置（preferredlocation）

相似考题

1.RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器数组、列表等中的所有元素构成新的RDD。()此题为判断题(对，错)。

2.以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。A.resetpartitionB.repartitonC.coalesceD.Partition

3.Spark中的每个RDD一般情况下是由()个分区组成的。A.无数B.多C.1D.0

4.SparkStreming中()函数可以通过对源DStream的每RDD应用RDD－to－RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。A.transB.reduceC.joinD.cogroup

更多“RDD特性包含如下哪些？（）A、一组分片（Partition），即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表，存储存取每个Partition的优先位置（preferredlocation）”相关问题

第1题：

以下属于spark启动后进程的是（）
- A、rdd是由一系列的partition组成的
- B、原子性
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第2题：

spark中的rdd是一个（）数据集
- A、弹性分布式
- B、弹性计算
- C、运送数据
- D、心跳
正确答案:A
第3题：

创建rdd可以有如下几种？（）
- A、由外部存储系统的数据集创建，包括本地的文件系统
- B、由一个已经存在的Scala集合创建
- C、比如所有Hadoop支持的数据集，比如HDFS、Cassandra、Hbase
- D、以上说法都不对
正确答案:A,B,C
第4题：

union算子对源RDD和参数RDD求并集后返回一个新的RDD

正确答案:正确
第5题：

以下关于rdd的特性说法错误的是（）
- A、rdd是仅仅由一组partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第6题：

以下选项属于rdd特性的是（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:C,D
第7题：

Spark中，以下哪些是rdd的特性（）
- A、partition大小
- B、partition个数
- C、partiton的所有者
- D、parrtition的一切
正确答案:C,D
第8题：

RDD之间宽窄依赖关系的主要依据哪个的对应关系来划分的（）
- A、partition
- B、worker
- C、master
- D、数据
正确答案:A
第9题：

RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

正确答案:正确
第10题：

以下哪些不属于rdd特性（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第11题：

单选题
下列有关RDD的说法中错误的是（）。
A
RDD是一个只读的，可分区的分布式数据集。
B
RDD默认存储在磁盘，当磁盘不足时，溢写到内存。
C
RDD数据以分区的形式在集群中存储。
D
RDD具有血统机制，发生数据丢失时，可快速进行数据恢复。

正确答案： B
解析：暂无解析
第12题：

( 难度：中等)关于spark中RDD说法错误的是：
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区，关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用，是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生

答案:D
第13题：

mapPartitions算子类似于map，但独立地在RDD的每一个分片上运行，因此在类型为T的RDD上运行时，func的函数类型必须是Iterator[T]=>Iterator[U]

正确答案:正确
第14题：

spark中以下哪些特性是rdd的特性（）
- A、计算移动
- B、数据不移动
- C、数据移动
- D、计算不移动
正确答案:A,C,D
第15题：

map算子返回一个新的RDD，该RDD由每一个输入元素经过func函数转换后组成

正确答案:正确
第16题：

spark在进行数据切分的时候，决定了partition的哪些属性（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第17题：

以下关于rdd的说法中，正确的是哪些（）
- A、rdd是由一系列partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,C,D
第18题：

spring中关于bean的说法正确的是（）
- A、rdd是由一组partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,C,D
第19题：

DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据

正确答案:正确
第20题：

以下选项中是persist算子在源码中具有哪些参数的是（）
- A、rdd是由一系列partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B,C
第21题：

filter算子返回一个新的RDD，该RDD由经过函数计算后返回值为true的输入元素组成

正确答案:正确
第22题：

在使用Ghost时，下列菜单中叙述错误的是：（）。
- A、Partition To Partition表示将一个分区的数据复制到另一个分区
- B、Partition To Image表示将一个分区的数据复制到一个磁盘文件
- C、Partition From Image表示将一个Image文件的数据恢复到一个分区上
- D、Disk To Disk表示将一个磁盘的数据移动到另一个磁盘上
正确答案:D
第23题：

问答题
试述如下Spark的几个主要概念：RDD、DAG、阶段、分区、窄依赖、宽依赖。

正确答案： ①RDD://是弹性分布式数据集（Resilient Distributed Dataset）的英文缩写，是分布式内存的一个抽象概念，提供了一种高度受限的共享内存模型。
②DAG://是Directed Acyclic Graph（有向无环图）的英文缩写，反映RDD之间的依赖关系。
③阶段：是作业的基本调度单位，一个作业会分为多组任务，每组任务被称为“阶段”，或者也被称为“任务集”。
④分区：一个RDD就是一个分布式对象集合，本质上是一个只读的分区记录集合，每个RDD可以分成多个分区，每个分区就是一个数据集片段。
⑤窄依赖：父RDD的一个分区只被一个子RDD的一个分区所使用就是窄依赖。
⑥宽依赖：父RDD的一个分区被一个子RDD的多个分区所使用就是宽依赖。
解析：暂无解析

RDD特性包含如下哪些？（）A、一组分片（Partition），即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表，存储存取每个Partition的优先位置（preferredlocation）

题目

相似考题

更多“RDD特性包含如下哪些？（）A、一组分片（Partition），即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表，存储存取每个Partition的优先位置（preferredlocation）”相关问题

相关内容