更多“描述Spark集群计算中RDD的含义和作用。”相关问题
  • 第1题:

    以下选项中属于spark架构中的图计算框架的是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:D

  • 第2题:

    spark中以下哪些特性是rdd的特性()

    • A、计算移动
    • B、数据不移动
    • C、数据移动
    • D、计算不移动

    正确答案:A,C,D

  • 第3题:

    以下关于rdd的特性说法错误的是()

    • A、rdd是仅仅由一组partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B

  • 第4题:

    spring中关于bean的说法正确的是()

    • A、rdd是由一组partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,C,D

  • 第5题:

    Spark中,以下哪些是rdd的特性()

    • A、partition大小
    • B、partition个数
    • C、partiton的所有者
    • D、parrtition的一切

    正确答案:C,D

  • 第6题:

    spark中的实时计算系统是哪个()

    • A、spark?core
    • B、spark?streaming
    • C、mlbase
    • D、Grophx

    正确答案:B

  • 第7题:

    描述鱼类集群的作用和生物学意义。


    正确答案: (1)在鱼类的防御方面
    (2)在鱼类索饵方面
    (3)在鱼类生殖方面
    (4)在鱼类的其它方面

  • 第8题:

    spark集群的web端口是哪个()

    • A、8080
    • B、8090
    • C、18080
    • D、4040

    正确答案:A

  • 第9题:

    RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合


    正确答案:正确

  • 第10题:

    spark中的图计算框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:D

  • 第11题:

    问答题
    Spark对RDD的操作主要分为行动(Action)和转换(Transformation)两种类型,两种类型操作的区别是什么?

    正确答案: 行动(Action):在数据集上进行运算,返回计算值。
    转换(Transformation):基于现有的数据集创建一个新的数据集。
    解析: 暂无解析

  • 第12题:

    问答题
    描述Spark集群计算中RDD的含义和作用。

    正确答案: Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD,把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算,数据在内存中将大大提升IO操作。这也是Spark涉及的核心:内存计算。Spark和RDD的关系可以理解为:RDD是一种具有容错性基于内存的集群计算抽象方法,Spark则是这个抽象方法的实现。
    解析: 暂无解析

  • 第13题:

    spark中的rdd是一个()数据集

    • A、弹性分布式
    • B、弹性计算
    • C、运送数据
    • D、心跳

    正确答案:A

  • 第14题:

    spark在进行数据切分的时候,决定了partition的哪些属性()

    • A、冗余性
    • B、一致性
    • C、rdd之间具有依赖性
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B

  • 第15题:

    以下关于rdd的说法中,正确的是哪些()

    • A、rdd是由一系列partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,C,D

  • 第16题:

    spark架构中的rdd相当于java中的()概念

    • A、类
    • B、接口
    • C、方法
    • D、内部类

    正确答案:A

  • 第17题:

    以下选项中是persist算子在源码中具有哪些参数的是()

    • A、rdd是由一系列partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B,C

  • 第18题:

    rdd是spark中个哪个架构提出的概念()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:A

  • 第19题:

    spark中的rdd相当于java中的()概念

    • A、类
    • B、接口
    • C、方法
    • D、内部类

    正确答案:A

  • 第20题:

    spark框架中,机器学习库的框架是哪个()

    • A、hadoop
    • B、spark?streaming
    • C、mlbase
    • D、RDD

    正确答案:C

  • 第21题:

    spark中的rdd不存储数据,存储的是()

    • A、业务逻辑
    • B、物理数据
    • C、数据库数据
    • D、物理逻辑

    正确答案:A

  • 第22题:

    多选题
    关于spark说法正确的是()。
    A

    调用RDD的Transformation算子可以立即发起job

    B

    NodeManager负责整个集群的资源统一调度和分配。

    C

    Yarn-client适合测试,Yarn-cluster适合生产。

    D

    Dataset具有RDD和DataFrame的优点,又避免它们的缺点。


    正确答案: A,C
    解析: 暂无解析

  • 第23题:

    多选题
    华为FusionInsightHD集群中,Spark服务可以从以下哪些服务读取数据?()
    A

    YARN

    B

    HDFS

    C

    Hive

    D

    HBase


    正确答案: D,C
    解析: 暂无解析