RDD特性包含如下哪些?()A、一组分片(Partition),即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表,存储存取每个Partition的优先位置(preferredlocation)

题目

RDD特性包含如下哪些?()

  • A、一组分片(Partition),即数据集的基本组成单位
  • B、一个计算每个分区的函数
  • C、RDD之间的依赖关系
  • D、一个列表,存储存取每个Partition的优先位置(preferredlocation)

相似考题
更多“RDD特性包含如下哪些?()A、一组分片(Partition),即数据集的基本组成单位B、一个计算每个分区的函数C、RDD之间的依赖关系D、一个列表,存储存取每个Partition的优先位置(preferredlocation)”相关问题
  • 第1题:

    以下属于spark启动后进程的是()

    • A、rdd是由一系列的partition组成的
    • B、原子性
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B

  • 第2题:

    spark中的rdd是一个()数据集

    • A、弹性分布式
    • B、弹性计算
    • C、运送数据
    • D、心跳

    正确答案:A

  • 第3题:

    创建rdd可以有如下几种?()

    • A、由外部存储系统的数据集创建,包括本地的文件系统
    • B、由一个已经存在的Scala集合创建
    • C、比如所有Hadoop支持的数据集,比如HDFS、Cassandra、Hbase
    • D、以上说法都不对

    正确答案:A,B,C

  • 第4题:

    union算子对源RDD和参数RDD求并集后返回一个新的RDD


    正确答案:正确

  • 第5题:

    以下关于rdd的特性说法错误的是()

    • A、rdd是仅仅由一组partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B

  • 第6题:

    以下选项属于rdd特性的是()

    • A、冗余性
    • B、一致性
    • C、rdd之间具有依赖性
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:C,D

  • 第7题:

    Spark中,以下哪些是rdd的特性()

    • A、partition大小
    • B、partition个数
    • C、partiton的所有者
    • D、parrtition的一切

    正确答案:C,D

  • 第8题:

    RDD之间宽窄依赖关系的主要依据哪个的对应关系来划分的()

    • A、partition
    • B、worker
    • C、master
    • D、数据

    正确答案:A

  • 第9题:

    RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合


    正确答案:正确

  • 第10题:

    以下哪些不属于rdd特性()

    • A、冗余性
    • B、一致性
    • C、rdd之间具有依赖性
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B

  • 第11题:

    单选题
    下列有关RDD的说法中错误的是()。
    A

    RDD是一个只读的,可分区的分布式数据集。

    B

    RDD默认存储在磁盘,当磁盘不足时,溢写到内存。

    C

    RDD数据以分区的形式在集群中存储。

    D

    RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。


    正确答案: B
    解析: 暂无解析

  • 第12题:

    ( 难度:中等)关于spark中RDD说法错误的是:
    A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
    B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
    C.宽依赖中会有shuffle的产生
    D.窄依赖中会有shuffle的产生

    答案:D

  • 第13题:

    mapPartitions算子类似于map,但独立地在RDD的每一个分片上运行,因此在类型为T的RDD上运行时,func的函数类型必须是Iterator[T]=>Iterator[U]


    正确答案:正确

  • 第14题:

    spark中以下哪些特性是rdd的特性()

    • A、计算移动
    • B、数据不移动
    • C、数据移动
    • D、计算不移动

    正确答案:A,C,D

  • 第15题:

    map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成


    正确答案:正确

  • 第16题:

    spark在进行数据切分的时候,决定了partition的哪些属性()

    • A、冗余性
    • B、一致性
    • C、rdd之间具有依赖性
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B

  • 第17题:

    以下关于rdd的说法中,正确的是哪些()

    • A、rdd是由一系列partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,C,D

  • 第18题:

    spring中关于bean的说法正确的是()

    • A、rdd是由一组partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,C,D

  • 第19题:

    DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据


    正确答案:正确

  • 第20题:

    以下选项中是persist算子在源码中具有哪些参数的是()

    • A、rdd是由一系列partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B,C

  • 第21题:

    filter算子返回一个新的RDD,该RDD由经过函数计算后返回值为true的输入元素组成


    正确答案:正确

  • 第22题:

    在使用Ghost时,下列菜单中叙述错误的是:()。

    • A、Partition To Partition表示将一个分区的数据复制到另一个分区
    • B、Partition To Image表示将一个分区的数据复制到一个磁盘文件
    • C、Partition From Image表示将一个Image文件的数据恢复到一个分区上
    • D、Disk To Disk表示将一个磁盘的数据移动到另一个磁盘上

    正确答案:D

  • 第23题:

    问答题
    试述如下Spark的几个主要概念:RDD、DAG、阶段、分区、窄依赖、宽依赖。

    正确答案: ①RDD://是弹性分布式数据集(Resilient Distributed Dataset)的英文缩写,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型。
    ②DAG://是Directed Acyclic Graph(有向无环图)的英文缩写,反映RDD之间的依赖关系。
    ③阶段:是作业的基本调度单位,一个作业会分为多组任务,每组任务被称为“阶段”,或者也被称为“任务集”。
    ④分区:一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合,每个RDD可以分成多个分区,每个分区就是一个数据集片段。
    ⑤窄依赖:父RDD的一个分区只被一个子RDD的一个分区所使用就是窄依赖。
    ⑥宽依赖:父RDD的一个分区被一个子RDD的多个分区所使用就是宽依赖。
    解析: 暂无解析