etl处理完成的数据可以存在以下哪些组件中()A、hdfsB、hiveC、hbaseD、mapreduce

题目

etl处理完成的数据可以存在以下哪些组件中()

  • A、hdfs
  • B、hive
  • C、hbase
  • D、mapreduce

相似考题
更多“etl处理完成的数据可以存在以下哪些组件中()A、hdfsB、hiveC、hbaseD、mapreduce”相关问题
  • 第1题:

    MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()

    • A、实时性
    • B、高容错性
    • C、易于扩展
    • D、易于编程

    正确答案:B,C,D

  • 第2题:

    在设计大数据架构的时候,可以使用以下哪些技术做etl()

    • A、mapreduce
    • B、hive
    • C、sql
    • D、oozie

    正确答案:A,B

  • 第3题:

    MapReduce更适合以下哪种大数据处理业务

    • A、ETL
    • B、迭代挖掘算法
    • C、图挖掘算法
    • D、统计

    正确答案:A,D

  • 第4题:

    MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。

    • A、分布
    • B、映射
    • C、分析
    • D、化简

    正确答案:B,D

  • 第5题:

    以下哪个组件和Tachyon是类似的组件()

    • A、hdfs
    • B、yarn
    • C、spark
    • D、mapreduce

    正确答案:A

  • 第6题:

    组件和组件、组件和接口都存在依赖关系;组件也可以包含在其他组件中。事物处理组件由3个独立组件组成:数据访问、事物逻辑和用户接口。


    正确答案:正确

  • 第7题:

    以下有关ETL表述不正确的是哪一个()

    • A、ETL由三个子过程构成:数据抽取、数据转换和数据加载
    • B、ETL又可以扩展为可以分为4个步骤:数据抽取、数据清洗、数据转换盒数据加载,即ETCL
    • C、ETL设计涉及到错误恢复过程设计、归档转储过程设计、作业调度过程设计等内容
    • D、根据选用的数据仓库工具将数据从数据源抽取到数据库,然后根据业务规则转换和集成为数据仓库中需要的数据格式,最后将换转的结果装入数据仓库

    正确答案:D

  • 第8题:

    单选题
    Hadoop中MapReduce组件擅长处理哪种场景的计算任务?()
    A

    迭代计算

    B

    离线计算

    C

    实时交互计算

    D

    流式计算


    正确答案: A
    解析: 暂无解析

  • 第9题:

    多选题
    MapReduce更适合以下哪种大数据处理业务
    A

    ETL

    B

    迭代挖掘算法

    C

    图挖掘算法

    D

    统计


    正确答案: B,A
    解析: 暂无解析

  • 第10题:

    判断题
    适合用MapReduce来处理的数据集(或任务)有一个基本要求:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理。(  )
    A

    B


    正确答案:
    解析:

  • 第11题:

    多选题
    MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。
    A

    分布

    B

    映射

    C

    分析

    D

    化简


    正确答案: B,A
    解析: 暂无解析

  • 第12题:

    ( 难度:中等)在进行数据开发的过程中主要应用到哪几个组件
    A.Python
    B.HDFS
    C.Hive
    D.MapReduce

    答案:BCD

  • 第13题:

    flume中数据可以写入到哪些位置?()

    • A、hdfs
    • B、日志文件
    • C、hbase
    • D、硬盘文件

    正确答案:A,B,C,D

  • 第14题:

    以下内容中,哪些是Openstack组件?()

    • A、Neutron
    • B、Nova
    • C、HBASE
    • D、Swift

    正确答案:A,B,D

  • 第15题:

    以下哪个不是评审逻辑模型设计阶段所提交的文档()

    • A、ETL程序和源代码
    • B、数据源状态报告
    • C、ETL数据质量控制策略及流程
    • D、ETL系统设计说明书

    正确答案:B

  • 第16题:

    大数据技术采用了很多开源工具,以下几种数据分析中采用的工具不是开源的是:()

    • A、SPSS
    • B、SPARK
    • C、HBASE
    • D、PIG

    正确答案:A

  • 第17题:

    SparkStreaming结果也能保存在很多地方比如如下那些选项?()

    • A、HDFS
    • B、数据库
    • C、Dashboards
    • D、zookeeper

    正确答案:A,B,C

  • 第18题:

    数据仓库的数据ETL过程中,ETL软件的主要功能包括:

    • A、数据抽取
    • B、数据转换
    • C、数据加载
    • D、数据稽核

    正确答案:A,B,C

  • 第19题:

    ()并行数据处理系统适用于需要多次操作特定数据集的场景,非常适合于机器学习中迭代算法的执行。

    • A、Spark
    • B、Hive
    • C、Haystack
    • D、HDFS

    正确答案:A

  • 第20题:

    多选题
    数据仓库的数据ETL过程中,ETL软件的主要功能包括:
    A

    数据抽取

    B

    数据转换

    C

    数据加载

    D

    数据稽核


    正确答案: B,C
    解析: 暂无解析

  • 第21题:

    单选题
    关于Hive和Hadoop其他组件的关系,以下描述错误的是?()
    A

    Hive最终将数据存储在HDFS中

    B

    HiveSQL其本质是执行MapReduce任务

    C

    Hive是Hadoop平台的数据仓库工具

    D

    Hive对HBase有强依赖


    正确答案: B
    解析: 暂无解析

  • 第22题:

    问答题
    MapReduce 是处理大数据的有力工具,但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

    正确答案: 适合用MapReduce来处理的数据集,需要满足一个前提条件:待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完全并行地进行处理。
    解析: 暂无解析

  • 第23题:

    ( 难度:中等)Hadoop的核心是()
    A.HDFS
    B.Flume
    C.HBase
    D.Hadoop

    答案:A