以下属于spark启动后进程的是（）A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

题目

以下属于spark启动后进程的是（）

A、rdd是由一系列的partition组成的
B、原子性
C、算子作用在partition上
D、每个rdd都会提供一批最优的计算位置

相似考题

1.以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。A.resetpartitionB.repartitonC.coalesceD.Partition

2.rdd是由一系列的什么组成的（）A、jobB、driverC、partitionD、worker

3.spark中的rdd是一个（）数据集A、弹性分布式B、弹性计算C、运送数据D、心跳

4.Spark中的每个RDD一般情况下是由()个分区组成的。A.无数B.多C.1D.0

更多“以下属于spark启动后进程的是（）A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置”相关问题

第1题：

count算子返回RDD的元素个数

正确答案:正确
第2题：

interSection算子对源RDD和参数RDD求交集后返回一个新的RDD

正确答案:正确
第3题：

union算子对源RDD和参数RDD求并集后返回一个新的RDD

正确答案:正确
第4题：

以下关于rdd的特性说法错误的是（）
- A、rdd是仅仅由一组partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第5题：

以下选项属于rdd特性的是（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:C,D
第6题：

Spark中，以下哪些是rdd的特性（）
- A、partition大小
- B、partition个数
- C、partiton的所有者
- D、parrtition的一切
正确答案:C,D
第7题：

以下选项中是persist算子在源码中具有哪些参数的是（）
- A、rdd是由一系列partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B,C
第8题：

描述Spark集群计算中RDD的含义和作用。

正确答案:Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算。Spark和RDD的关系可以理解为：RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。
第9题：

RDD特性包含如下哪些？（）
- A、一组分片（Partition），即数据集的基本组成单位
- B、一个计算每个分区的函数
- C、RDD之间的依赖关系
- D、一个列表，存储存取每个Partition的优先位置（preferredlocation）
正确答案:A,B,C,D
第10题：

filter算子返回一个新的RDD，该RDD由经过函数计算后返回值为true的输入元素组成

正确答案:正确
第11题：

以下哪些不属于rdd特性（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第12题：

问答题
描述Spark集群计算中RDD的含义和作用。

正确答案： Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算。Spark和RDD的关系可以理解为：RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。
解析：暂无解析
第13题：

spark中以下哪些特性是rdd的特性（）
- A、计算移动
- B、数据不移动
- C、数据移动
- D、计算不移动
正确答案:A,C,D
第14题：

map算子返回一个新的RDD，该RDD由每一个输入元素经过func函数转换后组成

正确答案:正确
第15题：

spark在进行数据切分的时候，决定了partition的哪些属性（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第16题：

以下关于rdd的说法中，正确的是哪些（）
- A、rdd是由一系列partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,C,D
第17题：

spring中关于bean的说法正确的是（）
- A、rdd是由一组partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,C,D
第18题：

DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据

正确答案:正确
第19题：

rdd是spark中个哪个架构提出的概念（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:A
第20题：

以下哪些是rdd的特性（）
- A、cache算子是persist算子的一个子集
- B、persist算子是cache算子的一个子集
- C、persist算子包含cache算子
- D、cache算子包含persist算子
正确答案:A,C,D
第21题：

spark框架中，机器学习库的框架是哪个（）
- A、hadoop
- B、spark？streaming
- C、mlbase
- D、RDD
正确答案:C
第22题：

distinct算子对源RDD进行去重后返回一个新的RDD

正确答案:正确
第23题：

多选题
关于spark说法正确的是（）。
A
调用RDD的Transformation算子可以立即发起job
B
NodeManager负责整个集群的资源统一调度和分配。
C
Yarn-client适合测试，Yarn-cluster适合生产。
D
Dataset具有RDD和DataFrame的优点，又避免它们的缺点。

正确答案： A,C
解析：暂无解析

以下属于spark启动后进程的是（）A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

题目

相似考题

更多“以下属于spark启动后进程的是（）A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置”相关问题

相关内容