以下关于Spark的描述正确的是?A.克服MapReduce在迭代式计算和交互式计算方面的不足。B.Mlib是Spark的机器学习库。C.Spark streaming是一个真正的实时计算框架。D.RDD 算子分为 transformation 和 action,transformation 是得到一个新的RDD。

题目

以下关于Spark的描述正确的是?

A.克服MapReduce在迭代式计算和交互式计算方面的不足。

B.Mlib是Spark的机器学习库。

C.Spark streaming是一个真正的实时计算框架。

D.RDD 算子分为 transformation 和 action,transformation 是得到一个新的RDD。


相似考题
参考答案和解析
ABCD
更多“以下关于Spark的描述正确的是?”相关问题
  • 第1题:

    spark支持的分布式部署方式中哪个是错误的()

    • A、standalone
    • B、spark on mesos
    • C、spark on YARN
    • D、spark on local

    正确答案:D

  • 第2题:

    spark中可以整合机器学习库,并可以对外提供接口的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:C

  • 第3题:

    spark框架中,整合机器学习库,并对外提供接口的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:C

  • 第4题:

    spark的核心框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:A

  • 第5题:

    以下选项中可以在spark中编写sql的框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、spark sql

    正确答案:D

  • 第6题:

    spark架构中会出现控制算子的原因是以下哪个选项()

    • A、spark备份的安全原因
    • B、spark用户的要求
    • C、兼容hive
    • D、兼容hbase

    正确答案:A

  • 第7题:

    以下选项中是spark的核心框架的是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:A

  • 第8题:

    关于spark中cache算子与persist算子关系叙述正确的是()

    • A、_useDisk
    • B、_useMemory
    • C、_useOffHeap
    • D、_useDes

    正确答案:A,C

  • 第9题:

    以下哪个选项是spark的核心框架?()

    • A、spark?core
    • B、spark?streaming
    • C、hdfs
    • D、hadoop

    正确答案:A

  • 第10题:

    spark的组件不包含哪个()

    • A、spark core
    • B、hdfs
    • C、Graphx
    • D、spark streaming

    正确答案:B

  • 第11题:

    以下哪个软件是Spark中用于图计算的产品

    • A、GraphX
    • B、HAMA
    • C、Hive
    • D、Pig

    正确答案:A

  • 第12题:

    单选题
    spark是用以下哪种编程语言实现的()。
    A

    C语言

    B

    C++

    C

    java

    D

    Scala


    正确答案: A
    解析: 暂无解析

  • 第13题:

    spark中,可以运行sql脚本的框架是哪个()

    • A、spark?core
    • B、hdfs
    • C、hadoop
    • D、spark?sql

    正确答案:D

  • 第14题:

    在Spark中以下算子属于执行算子的是()

    • A、map
    • B、foreach
    • C、flatmap
    • D、join

    正确答案:B

  • 第15题:

    spark中的实时计算系统是哪个()

    • A、spark?core
    • B、spark?streaming
    • C、mlbase
    • D、Grophx

    正确答案:B

  • 第16题:

    描述Spark集群计算中RDD的含义和作用。


    正确答案:Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD,把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算,数据在内存中将大大提升IO操作。这也是Spark涉及的核心:内存计算。Spark和RDD的关系可以理解为:RDD是一种具有容错性基于内存的集群计算抽象方法,Spark则是这个抽象方法的实现。

  • 第17题:

    spark架构中cache算子应具有以下哪些特性?()

    • A、spark?core
    • B、spark?streaming
    • C、Grophx
    • D、spark?sql

    正确答案:A,B,D

  • 第18题:

    以下和spark中一个action算子对应的是()

    • A、job
    • B、task
    • C、driver
    • D、stage

    正确答案:A

  • 第19题:

    spark框架中,机器学习库的框架是哪个()

    • A、hadoop
    • B、spark?streaming
    • C、mlbase
    • D、RDD

    正确答案:C

  • 第20题:

    下列选项中是spark组件的有?()

    • A、spark core
    • B、spark streaming
    • C、Grophx
    • D、spark sql

    正确答案:A,B,C,D

  • 第21题:

    spark支持以下哪种运行模式()

    • A、java
    • B、python
    • C、scala
    • D、go

    正确答案:A,B,C

  • 第22题:

    spark中的图计算框架是()

    • A、spark core
    • B、spark streaming
    • C、mlbase
    • D、Grophx

    正确答案:D

  • 第23题:

    单选题
    Spark是用以下哪种变成语言实现的?()
    A

    C

    B

    C++

    C

    JAVA

    D

    Scala


    正确答案: D
    解析: 暂无解析

  • 第24题:

    问答题
    描述Spark集群计算中RDD的含义和作用。

    正确答案: Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD,把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算,数据在内存中将大大提升IO操作。这也是Spark涉及的核心:内存计算。Spark和RDD的关系可以理解为:RDD是一种具有容错性基于内存的集群计算抽象方法,Spark则是这个抽象方法的实现。
    解析: 暂无解析