Spark可以使用Hadoop的YARN和ApacheMesos作为它的资源管理和调度器,并且可以处理所有Hadoop支持的数据,包括HDFS、HBase和Cassandra等
第1题:
A.Hive
B.Pig
C.GraphX
D.Hbase
第2题:
Hadoop之父DougCutting曾曰Spark迟早会把mapreduce给取代,意味着hadoop已经走向没落,会被取代逐渐淘汰
第3题:
Spark也可以不依赖于第三方的资源管理和调度器,它实现了()作为其内置的资源管理和调度框架
第4题:
以下哪个选项是spark的核心框架?()
第5题:
内存计算下,Spark?比?Hadoop?快10倍
第6题:
Hbase(hadoop base)是一个非关系型数据库的一种。
第7题:
数据存储和管理
数据导入和导出
数据备份和恢复
资源调度与隔离
第8题:
Hive最终将数据存储在HDFS中
HiveSQL其本质是执行MapReduce任务
Hive是Hadoop平台的数据仓库工具
Hive对HBase有强依赖
第9题:
对
错
第10题:
第11题:
(难度:中等)hadoop dfsadmin –report 命令用于检测 HDFS 损坏块。
答案:(no)
第12题:
( 难度:中等)下列关于Hadoop API的说法正确的是
A.Hadoop的文件API不是通用的,只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是javio.DataInputStream的子类
答案:BCD
第13题:
创建rdd可以有如下几种?()
第14题:
以下哪些产品属于Hadoop软件栈
第15题:
Hive?是建立在Hadoop?之上的,所有?Hive?的数据都是存储在HDFS?中的
第16题:
Hive架构建立在Hadoop之上的,所有Hive中数据都是存储在HDFS中
第17题:
saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下,可以使HDFS或者其他Hadoop支持的文件系统
第18题:
大数据查询分析计算的典型系统包括()。
第19题:
Flink能够支持Yarn,能够从HDFS和HBase中获取数据
能够使用所有的Hadoop的格式化输入和输出
能够使用Hadoop原有的Mappers和Reducers,但不能与Flink的操作混合使用
能够更快的运行Hadoop的作业
第20题:
对
错
第21题:
内存
CPU
网络
磁盘空间
第22题:
NameNode
DataNode
ZooKeeper
JobTraoker
第23题:
( 难度:中等)以下哪些命令可以查看hadoop中的文件大小
A.hdfs dfs -ls
B.hdfs dfs -cat
C.hdfs dfs -count
D.hdfs dfs -du
答案:ACD