更多“Spark因为其处理数据的方式不一样,比MapReduce要快得多。”相关问题
  • 第1题:

    Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性


    正确答案:正确

  • 第2题:

    spark架构计算速度比mapreduce计算速度快单纯因为内存


    正确答案:错误

  • 第3题:

    Hadoop之父DougCutting曾曰Spark迟早会把mapreduce给取代,意味着hadoop已经走向没落,会被取代逐渐淘汰


    正确答案:错误

  • 第4题:

    与Hadoop的MapReduce相比,Spark基于内存的运算要快100倍以上,基于硬盘的运算也要快10倍以上


    正确答案:正确

  • 第5题:

    etl处理完成的数据可以存在以下哪些组件中()

    • A、hdfs
    • B、hive
    • C、hbase
    • D、mapreduce

    正确答案:A,B,C

  • 第6题:

    spark比mapreduce快的原因不仅仅是因为内存


    正确答案:正确

  • 第7题:

    与spark基于内存相比,mapreduce是基于()运行的计算框架

    • A、内存
    • B、磁盘
    • C、内存加磁盘
    • D、网络

    正确答案:B

  • 第8题:

    水中的散热速度比陆地上的散热速度要快得多。()


    正确答案:正确

  • 第9题:

    判断题
    内存储器存储数据的速度比外存储器要快得多。( )
    A

    B


    正确答案:
    解析: 由于内存储器直接与CPU进行数据交换,所以它的存取数据的速度比外存储器要快得多。

  • 第10题:

    判断题
    水中的散热速度比陆地上的散热速度要快得多。()
    A

    B


    正确答案:
    解析: 暂无解析

  • 第11题:

    判断题
    RRPP收敛性能比MSTP要快得多。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第12题:

    多选题
    关于Spark和Mapreduce,下列说法正确的是()。
    A

    性能上提升高于100倍(全内存计算)

    B

    Spark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更低。

    C

    提供更多的数据集操作类型,编程模型更灵活,开发效率更高。

    D

    更低的容错能力(血统机制)。

    E

    Spark用十分之一的资源,获得10倍与Mapreduce的性能。


    正确答案: E,B
    解析: 暂无解析

  • 第13题:

    多组分配合料的硅酸盐形成和玻璃液的形成的时间比单组分、两组分配合料要快得多,这是因为()。


    正确答案:形成低共熔化合物

  • 第14题:

    spark计算速度比mapreduce计算速度快,不仅仅是因为内存


    正确答案:正确

  • 第15题:

    spark支持的分布式部署方式中哪个是错误的()

    • A、standalone
    • B、spark on mesos
    • C、spark on YARN
    • D、spark on local

    正确答案:D

  • 第16题:

    spark的源码是由哪几种语言编写完成的()

    • A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
    • B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
    • C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
    • D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景

    正确答案:A,B

  • 第17题:

    spark读取hdfs数据是调用哪个技术实现的()

    • A、spark?core
    • B、spark?streaming
    • C、mapreduce
    • D、Grophx

    正确答案:C

  • 第18题:

    Spark Streaming类似于Apache Storm,用于流式数据的处理


    正确答案:正确

  • 第19题:

    spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集

    • A、单机
    • B、集中式
    • C、分布式
    • D、NOSQL

    正确答案:C

  • 第20题:

    为什么直流锅炉运行参数的变化速度比汽包锅炉要快得多?


    正确答案: 汽包锅炉水容积大,汽包壁和下降管管壁厚,因而工质和金属的蓄热能力比较高,所以保持自平衡的能力较强。直流炉采取薄管壁、小管径的管子,水容积和蓄热能力均比同容量汽包锅炉小,所以当运行工况变化时,运行参数的变化速度比汽包锅炉快得多。

  • 第21题:

    问答题
    Spark的出现是为了解决Hadoop MapReduce的不足,试列举Hadoop MapReduce的几个缺陷,并说明Spark具备哪些优点。

    正确答案: (1)Hadoop存在以下缺点:
    ①表达能力有限;②磁盘IO开销大;③延迟高
    (2)Spark主要有如下优点:
    ①Spark的计算模式也属于MapReduce,但不局限于Map和Reduce操作,还提供了多种数据集操作类型,编程模型比MapReduce更灵活;
    ②Spark提供了内存计算,中间结果直接存放内存中,带来更高的迭代运算效率;
    ③Spark基于DAG的任务调度执行机制,要优于MapReduce的迭代执行机制。
    解析: 暂无解析

  • 第22题:

    判断题
    内存储器存储数据的速度比存储器要快得多。
    A

    B


    正确答案:
    解析: 由于内存储器直接与CPU进行数据交换,所以它的存取数据的速度比外存储器要快得多。

  • 第23题:

    判断题
    Spark是一个类似于MapReduce的分布式计算框架,其核心是弹性分布式数据集
    A

    B


    正确答案:
    解析: 暂无解析

  • 第24题:

    问答题
    MapReduce 是处理大数据的有力工具,但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

    正确答案: 适合用MapReduce来处理的数据集,需要满足一个前提条件:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理。
    解析: 暂无解析