etl处理完成的数据可以存在以下哪些组件中（）A、hdfsB、hiveC、hbaseD、mapreduce

题目

etl处理完成的数据可以存在以下哪些组件中（）

A、hdfs
B、hive
C、hbase
D、mapreduce

相似考题

1.下列哪个组件不属于FusionInsight架构的Hadoop层()A.HDFSB.HBase7/75C.MinerD.Hive

2.以下不是非关系数据库的是()。A、RedisB、MongoDBC、HbaseD、Oracle

3.数据仓库的数据ETL过程中,ETL软件的主要功能包括:A.数据抽取B.数据转换C.数据加载D.数据稽核

4.Spark可以从()分布式文件系统中读取数据。A.TachyonB.HiveC.HbaseD.HDFS

更多“etl处理完成的数据可以存在以下哪些组件中（）A、hdfsB、hiveC、hbaseD、mapreduce”相关问题

第1题：

MapReduce是一种编程模型，用于大规模数据集的并行运算，可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项？（）
- A、实时性
- B、高容错性
- C、易于扩展
- D、易于编程
正确答案:B,C,D
第2题：

在设计大数据架构的时候，可以使用以下哪些技术做etl（）
- A、mapreduce
- B、hive
- C、sql
- D、oozie
正确答案:A,B
第3题：

MapReduce更适合以下哪种大数据处理业务
- A、ETL
- B、迭代挖掘算法
- C、图挖掘算法
- D、统计
正确答案:A,D
第4题：

MapReduce包括（）和（）两个阶段，可以进行海量数据分割、任务分解与结果汇总，从而完成海量数据的并行处理。
- A、分布
- B、映射
- C、分析
- D、化简
正确答案:B,D
第5题：

以下哪个组件和Tachyon是类似的组件（）
- A、hdfs
- B、yarn
- C、spark
- D、mapreduce
正确答案:A
第6题：

组件和组件、组件和接口都存在依赖关系；组件也可以包含在其他组件中。事物处理组件由3个独立组件组成：数据访问、事物逻辑和用户接口。

正确答案:正确
第7题：

以下有关ETL表述不正确的是哪一个（）
- A、ETL由三个子过程构成：数据抽取、数据转换和数据加载
- B、ETL又可以扩展为可以分为4个步骤：数据抽取、数据清洗、数据转换盒数据加载，即ETCL
- C、ETL设计涉及到错误恢复过程设计、归档转储过程设计、作业调度过程设计等内容
- D、根据选用的数据仓库工具将数据从数据源抽取到数据库，然后根据业务规则转换和集成为数据仓库中需要的数据格式，最后将换转的结果装入数据仓库
正确答案:D
第8题：

单选题
Hadoop中MapReduce组件擅长处理哪种场景的计算任务？（）
A
迭代计算
B
离线计算
C
实时交互计算
D
流式计算

正确答案： A
解析：暂无解析
第9题：

多选题
MapReduce更适合以下哪种大数据处理业务
A
ETL
B
迭代挖掘算法
C
图挖掘算法
D
统计

正确答案： B,A
解析：暂无解析
第10题：

判断题
适合用MapReduce来处理的数据集(或任务)有一个基本要求:待处理的数据集可以分解成许多小的数据集，而且每一个小数据集都可以完全并行地进行处理。( )
A
对
B
错

正确答案：对
解析：
第11题：

多选题
MapReduce包括（）和（）两个阶段，可以进行海量数据分割、任务分解与结果汇总，从而完成海量数据的并行处理。
A
分布
B
映射
C
分析
D
化简

正确答案： B,A
解析：暂无解析
第12题：

( 难度：中等)在进行数据开发的过程中主要应用到哪几个组件
A.Python
B.HDFS
C.Hive
D.MapReduce

答案:BCD
第13题：

flume中数据可以写入到哪些位置？（）
- A、hdfs
- B、日志文件
- C、hbase
- D、硬盘文件
正确答案:A,B,C,D
第14题：

以下内容中，哪些是Openstack组件？（）
- A、Neutron
- B、Nova
- C、HBASE
- D、Swift
正确答案:A,B,D
第15题：

以下哪个不是评审逻辑模型设计阶段所提交的文档（）
- A、ETL程序和源代码
- B、数据源状态报告
- C、ETL数据质量控制策略及流程
- D、ETL系统设计说明书
正确答案:B
第16题：

大数据技术采用了很多开源工具，以下几种数据分析中采用的工具不是开源的是：（）
- A、SPSS
- B、SPARK
- C、HBASE
- D、PIG
正确答案:A
第17题：

SparkStreaming结果也能保存在很多地方比如如下那些选项？（）
- A、HDFS
- B、数据库
- C、Dashboards
- D、zookeeper
正确答案:A,B,C
第18题：

数据仓库的数据ETL过程中，ETL软件的主要功能包括:
- A、数据抽取
- B、数据转换
- C、数据加载
- D、数据稽核
正确答案:A,B,C
第19题：

（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。
- A、Spark
- B、Hive
- C、Haystack
- D、HDFS
正确答案:A
第20题：

多选题
数据仓库的数据ETL过程中，ETL软件的主要功能包括:
A
数据抽取
B
数据转换
C
数据加载
D
数据稽核

正确答案： B,C
解析：暂无解析
第21题：

单选题
关于Hive和Hadoop其他组件的关系，以下描述错误的是？（）
A
Hive最终将数据存储在HDFS中
B
HiveSQL其本质是执行MapReduce任务
C
Hive是Hadoop平台的数据仓库工具
D
Hive对HBase有强依赖

正确答案： B
解析：暂无解析
第22题：

问答题
MapReduce 是处理大数据的有力工具，但不是每个任务都可以使用MapReduce 来进行处理。试述适合用MapReduce来处理的任务或者数据集需满足怎样的要求。

正确答案：适合用MapReduce来处理的数据集，需要满足一个前提条件：待处理的数据集可以分解成许多小的数据集，而且每一个小数据集都可以完全并行地进行处理。
解析：暂无解析
第23题：

( 难度：中等)Hadoop的核心是()
A.HDFS
B.Flume
C.HBase
D.Hadoop

答案:A

etl处理完成的数据可以存在以下哪些组件中（）A、hdfsB、hiveC、hbaseD、mapreduce

题目

相似考题

更多“etl处理完成的数据可以存在以下哪些组件中（）A、hdfsB、hiveC、hbaseD、mapreduce”相关问题

相关内容