etl处理完成的数据可以存在以下哪些组件中()
第1题:
MapReduce是一种编程模型,用于大规模数据集的并行运算,可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项?()
第2题:
在设计大数据架构的时候,可以使用以下哪些技术做etl()
第3题:
MapReduce更适合以下哪种大数据处理业务
第4题:
MapReduce包括()和()两个阶段,可以进行海量数据分割、任务分解与结果汇总,从而完成海量数据的并行处理。
第5题:
以下哪个组件和Tachyon是类似的组件()
第6题:
组件和组件、组件和接口都存在依赖关系;组件也可以包含在其他组件中。事物处理组件由3个独立组件组成:数据访问、事物逻辑和用户接口。
第7题:
以下有关ETL表述不正确的是哪一个()
第8题:
迭代计算
离线计算
实时交互计算
流式计算
第9题:
ETL
迭代挖掘算法
图挖掘算法
统计
第10题:
对
错
第11题:
分布
映射
分析
化简
第12题:
( 难度:中等)在进行数据开发的过程中主要应用到哪几个组件
A.Python
B.HDFS
C.Hive
D.MapReduce
答案:BCD
第13题:
flume中数据可以写入到哪些位置?()
第14题:
以下内容中,哪些是Openstack组件?()
第15题:
以下哪个不是评审逻辑模型设计阶段所提交的文档()
第16题:
大数据技术采用了很多开源工具,以下几种数据分析中采用的工具不是开源的是:()
第17题:
SparkStreaming结果也能保存在很多地方比如如下那些选项?()
第18题:
数据仓库的数据ETL过程中,ETL软件的主要功能包括:
第19题:
()并行数据处理系统适用于需要多次操作特定数据集的场景,非常适合于机器学习中迭代算法的执行。
第20题:
数据抽取
数据转换
数据加载
数据稽核
第21题:
Hive最终将数据存储在HDFS中
HiveSQL其本质是执行MapReduce任务
Hive是Hadoop平台的数据仓库工具
Hive对HBase有强依赖
第22题:
第23题:
( 难度:中等)Hadoop的核心是()
A.HDFS
B.Flume
C.HBase
D.Hadoop
答案:A