spark在进行数据切分的时候，决定了partition的哪些属性（）A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

题目

spark在进行数据切分的时候，决定了partition的哪些属性（）

A、冗余性
B、一致性
C、rdd之间具有依赖性
D、每个rdd都会提供一批最优的计算位置

相似考题

1.以下哪种方法可以让Spark不自定义分区也能对任何类型RDD简单重分区()。A.resetpartitionB.repartitonC.coalesceD.Partition

2.以下属于spark启动后进程的是（）A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置

3.partition的哪些属性是在spark进行数据切分的时候决定的（）A、partition大小B、partition个数C、partiton的所有者D、parrtition的一切

4.Spark中的每个RDD一般情况下是由()个分区组成的。A.无数B.多C.1D.0

更多“spark在进行数据切分的时候，决定了partition的哪些属性（）A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置”相关问题

第1题：

spark中的rdd是一个（）数据集
- A、弹性分布式
- B、弹性计算
- C、运送数据
- D、心跳
正确答案:A
第2题：

spark在进行数据切分的时候，下列哪些属性和partition划分有关（）
- A、partition大小
- B、partition个数
- C、partiton的所有者
- D、parrtition的一切
正确答案:A,B
第3题：

以下关于rdd的说法中，正确的是哪些（）
- A、rdd是由一系列partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,C,D
第4题：

spring中关于bean的说法正确的是（）
- A、rdd是由一组partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,C,D
第5题：

DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据

正确答案:正确
第6题：

rdd是spark中个哪个架构提出的概念（）
- A、spark core
- B、spark streaming
- C、mlbase
- D、Grophx
正确答案:A
第7题：

RDD特性包含如下哪些？（）
- A、一组分片（Partition），即数据集的基本组成单位
- B、一个计算每个分区的函数
- C、RDD之间的依赖关系
- D、一个列表，存储存取每个Partition的优先位置（preferredlocation）
正确答案:A,B,C,D
第8题：

spark进行数据切分的时候，划分完成的partition个数和hdfs中block个数一致

正确答案:正确
第9题：

RDD（ResilientDistributedDataset）叫做分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合

正确答案:正确
第10题：

spark中的rdd不存储数据，存储的是（）
- A、业务逻辑
- B、物理数据
- C、数据库数据
- D、物理逻辑
正确答案:A
第11题：

判断题
RDD可以从Hadoop兼容的文件系统生成，生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
A
对
B
错

正确答案：错
解析：暂无解析
第12题：

( 难度：中等)关于spark中RDD说法错误的是：
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区，关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用，是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生

答案:D
第13题：

spark中以下哪些特性是rdd的特性（）
- A、计算移动
- B、数据不移动
- C、数据移动
- D、计算不移动
正确答案:A,C,D
第14题：

以下关于rdd的特性说法错误的是（）
- A、rdd是仅仅由一组partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第15题：

以下选项属于rdd特性的是（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:C,D
第16题：

Spark中，以下哪些是rdd的特性（）
- A、partition大小
- B、partition个数
- C、partiton的所有者
- D、parrtition的一切
正确答案:C,D
第17题：

以下选项中是persist算子在源码中具有哪些参数的是（）
- A、rdd是由一系列partition够成的
- B、rdd之间都是独立的，没有依赖
- C、算子作用在partition上
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B,C
第18题：

描述Spark集群计算中RDD的含义和作用。

正确答案:Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算。Spark和RDD的关系可以理解为：RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。
第19题：

spark中的rdd相当于java中的（）概念
- A、类
- B、接口
- C、方法
- D、内部类
正确答案:A
第20题：

spark框架中，机器学习库的框架是哪个（）
- A、hadoop
- B、spark？streaming
- C、mlbase
- D、RDD
正确答案:C
第21题：

以下哪些不属于rdd特性（）
- A、冗余性
- B、一致性
- C、rdd之间具有依赖性
- D、每个rdd都会提供一批最优的计算位置
正确答案:A,B
第22题：

SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做（）的可编程抽象数据模型
- A、DataFrames
- B、Table
- C、DataSet
- D、RDD
正确答案:A
第23题：

问答题
描述Spark集群计算中RDD的含义和作用。

正确答案： Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算。Spark和RDD的关系可以理解为：RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。
解析：暂无解析

spark在进行数据切分的时候，决定了partition的哪些属性（）A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置

题目

相似考题

更多“spark在进行数据切分的时候，决定了partition的哪些属性（）A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置”相关问题

相关内容