相对于Hadoop1.0而言,Hadoop2.0主要增加了HDFS HA和HDFS Federation(联邦)等特性。
第1题:
此题为判断题(对,错)。
第2题:
A.两者都起守护进程,且守护进程运行在一台机器上
B.单机模式不使用HDFS,但加载守护进程
C.两者都不与守护进程交互,避免复杂性
D.后者比前者增加了HDFS输入输出以及可检查内存使用情况
第3题:
spark本身能够读取到hdfs中的数据
第4题:
spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致
第5题:
Spark可以使用Hadoop的YARN和ApacheMesos作为它的资源管理和调度器,并且可以处理所有Hadoop支持的数据,包括HDFS、HBase和Cassandra等
第6题:
Hadoop中用于图计算的产品是以下哪些
第7题:
第8题:
第9题:
支持回收站机制,以及副本数的动态设置机制
数据存储以数据块为单位,存储在操作系统的HDFS文件系统上
提供JAVAAPI,HTTP方式,SHELL方式访问HDFS数据
HDFS对外仅呈现多个统一的文件系统
第10题:
高容错性
高吞吐量
大文件存储
高精确度
第11题:
高容错性
高吞吐量
高随机性
大文件存储
第12题:
第13题:
A、NameNodeB、Jobtracker
B、Datanode
C、Secondary namenode
D、tasktracker
第14题:
答案:Hadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFile System)。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。
第15题:
hdfs备份的策略是()
第16题:
hdfs与tachyon的主要区别是()
第17题:
关于Hadoop单机模式和伪分布式模式的说法,正确的是()?
第18题:
HDFS系统主要包括()两类节点。
第19题:
第20题:
Namenode
Syste
Datanode
Standby NameNode
第21题:
NameNode
DateNode
Block
Client
第22题:
NameNode
DataNode
Client
Blockops
第23题:
高容错性
高吞吐量
大文件存储
以上都是
第24题:
元数据节点
数据节点
元节点
子节点