描述Spark集群计算中RDD的含义和作用。

题目

相似考题

1.Spark只有键值对类型的RDD才能设置分区方式。()此题为判断题(对，错)。

2.Spark中的每个RDD一般情况下是由()个分区组成的。A.无数B.多C.1D.0

3.以下属于spark启动后进程的是（）A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

4.以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。A.resetpartitionB.repartitonC.coalesceD.Partition

更多“描述Spark集群计算中RDD的含义和作用。”相关问题

第1题：

以下选项中属于spark架构中的图计算框架的是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:D
第2题：

spark中以下哪些特性是rdd的特性（）
- A、计算移动
- B、数据不移动
- C、数据移动
- D、计算不移动
正确答案:A,C,D
第3题：

以下关于rdd的特性说法错误的是（）
- A、rdd是仅仅由一组partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第4题：

spring中关于bean的说法正确的是（）
- A、rdd是由一组partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,C,D
第5题：

Spark中，以下哪些是rdd的特性（）
- A、partition大小
- B、partition个数
- C、partiton的所有者
- D、parrtition的一切
正确答案:C,D
第6题：

spark中的实时计算系统是哪个（）
- A、spark？core
- B、spark？streaming
- C、mlbase
- D、Grophx
正确答案:B
第7题：

描述鱼类集群的作用和生物学意义。

正确答案: （1）在鱼类的防御方面
（2）在鱼类索饵方面
（3）在鱼类生殖方面
（4）在鱼类的其它方面
第8题：

spark集群的web端口是哪个（）
- A、8080
- B、8090
- C、18080
- D、4040
正确答案:A
第9题：

RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

正确答案:正确
第10题：

spark中的图计算框架是（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:D
第11题：

问答题
Spark对RDD的操作主要分为行动（Action）和转换（Transformation）两种类型，两种类型操作的区别是什么？

正确答案：行动（Action）：在数据集上进行运算，返回计算值。
转换（Transformation）：基于现有的数据集创建一个新的数据集。
解析：暂无解析
第12题：

问答题
描述Spark集群计算中RDD的含义和作用。

正确答案： Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算。Spark和RDD的关系可以理解为：RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。
解析：暂无解析
第13题：

spark中的rdd是一个（）数据集
- A、弹性分布式
- B、弹性计算
- C、运送数据
- D、心跳
正确答案:A
第14题：

spark在进行数据切分的时候，决定了partition的哪些属性（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第15题：

以下关于rdd的说法中，正确的是哪些（）
- A、rdd是由一系列partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,C,D
第16题：

spark架构中的rdd相当于java中的（）概念
- A、类
- B、接口
- C、方法
- D、内部类
正确答案:A
第17题：

以下选项中是persist算子在源码中具有哪些参数的是（）
- A、rdd是由一系列partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B,C
第18题：

rdd是spark中个哪个架构提出的概念（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:A
第19题：

spark中的rdd相当于java中的（）概念
- A、类
- B、接口
- C、方法
- D、内部类
正确答案:A
第20题：

spark框架中，机器学习库的框架是哪个（）
- A、hadoop
- B、spark？streaming
- C、mlbase
- D、RDD
正确答案:C
第21题：

spark中的rdd不存储数据，存储的是（）
- A、业务逻辑
- B、物理数据
- C、数据库数据
- D、物理逻辑
正确答案:A
第22题：

多选题
关于spark说法正确的是（）。
A
调用RDD的Transformation算子可以立即发起job
B
NodeManager负责整个集群的资源统一调度和分配。
C
Yarn-client适合测试，Yarn-cluster适合生产。
D
Dataset具有RDD和DataFrame的优点，又避免它们的缺点。

正确答案： A,C
解析：暂无解析
第23题：

多选题
华为FusionInsightHD集群中，Spark服务可以从以下哪些服务读取数据？（）
A
YARN
B
HDFS
C
Hive
D
HBase

正确答案： D,C
解析：暂无解析

描述Spark集群计算中RDD的含义和作用。

题目

相似考题

更多“描述Spark集群计算中RDD的含义和作用。”相关问题

相关内容