saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下，可以使HDFS或者其他Hadoop支持的文件系统

题目

相似考题

1.新浪网站的主页地址是：http：//www.sina.com，打开此主页，浏览“体育”页面，将“曼联”页面内容以文本文件的格式保存到指定的目录下，命名为“oliver.txt”。

2.Hadoop的HDFS是一种分布式文件系统,适合高容错、高吞吐量场景的数据存储和管理。()此题为判断题(对，错)。

3.某体育网站的主页地址是：http：//www.343.com，打开此主页，浏览“中国足球”页面，将“足球联赛”页面内容以文本文件的格式保存到指定的目录下，命名为“zqls.txt”。

4.Convert命令的作用是()A.可以将NTFS格式的文件系统在不损伤数据的情况下将其转换成FATB.可以将NTFS格式的文件系统在数据轻微损伤的情况下，将其转换成FATC.可以将FAT格式下的文件系统在不损伤数据的情况下将其转成NTFSD.可以将FAT格式下的文件系统在数据轻微损伤的情况下，将其转换成NTFS

参考答案和解析

正确答案:正确

更多“saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下，可以使HDFS或者其他Hadoop支持的文件系统”相关问题

第1题：

在大数据关键技术中，Hadoop的分布式文件系统HDFS属于大数据（）。

A.存储技术
B.分析技术
C.并行分析技术
D.挖掘技术

答案：A
解析：
教材P85，大数据关键技术，谷歌文件系统（GFS）和Hadoop的分布式文件系统HDFS奠定了大数据存储技术的基础。
第2题：

关于数据备份说法错误的是（）
- A、将数据备份到文件时，必须指定文件要保存的名称和位置
- B、备份文件可以保存到硬盘、软盘或任何其他可以保存文件的可移动或不可移动媒体
- C、将数据备份到磁带时，计算机必须接有磁带设备
- D、备份工具支持使用CD-RW（可重写光盘）和CD-R（可读写光盘）
正确答案:D
第3题：

创建rdd可以有如下几种？（）
- A、由外部存储系统的数据集创建，包括本地的文件系统
- B、由一个已经存在的Scala集合创建
- C、比如所有Hadoop支持的数据集，比如HDFS、Cassandra、Hbase
- D、以上说法都不对
正确答案:A,B,C
第4题：

Hive？是建立在Hadoop？之上的，所有？Hive？的数据都是存储在HDFS？中的

正确答案:正确
第5题：

Spark可以使用Hadoop的YARN和ApacheMesos作为它的资源管理和调度器，并且可以处理所有Hadoop支持的数据，包括HDFS、HBase和Cassandra等

正确答案:正确
第6题：

分布式文件系统HDFS主要由哪些功能模块构成（）
- A、客户端模块
- B、数据划分模块
- C、数据存储服务模块
- D、元数据管理模块
正确答案:A,C,D
第7题：

单选题
下面关于HDFS架构关键设计要点错误的是（）。
A
支持回收站机制，以及副本数的动态设置机制
B
数据存储以数据块为单位，存储在操作系统的HDFS文件系统上
C
提供JAVAAPI，HTTP方式，SHELL方式访问HDFS数据
D
HDFS对外仅呈现多个统一的文件系统

正确答案： A
解析：暂无解析
第8题：

多选题
Hadoop分布式文件系统（HDFS）具有（）的特性。
A
适合数据批量处理
B
数据处理能力极强
C
最大化吞吐率
D
允许计算向数据迁移
E
适合多线程问题

正确答案： E,C
解析：暂无解析
第9题：

单选题
关于数据备份说法错误的是（）
A
将数据备份到文件时，必须指定文件要保存的名称和位置
B
备份文件可以保存到硬盘、软盘或任何其他可以保存文件的可移动或不可移动媒体
C
将数据备份到磁带时，计算机必须接有磁带设备
D
备份工具支持使用CD-RW（可重写光盘）和CD-R（可读写光盘）

正确答案： C
解析：暂无解析
第10题：

多选题
Hadoop的HDFS是一种分布式文件系统，适合以下哪种场景的数据存储和管理？（）
A
大量小文件存储
B
高容错，高吞吐量
C
低延迟读取
D
流式数据访问

正确答案： D,B
解析：暂无解析
第11题：

(难度：中等)可以使用Flume将MySQL中的数据写入hdfs中

答案:(yes)
第12题：

( 难度：中等)下列关于Hadoop API的说法正确的是
A.Hadoop的文件API不是通用的，只用于HDFS文件系统
B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的
C.FileStatus对象存储文件和目录的元数据
D.FSDataInputStream是javio.DataInputStream的子类

答案:BCD
第13题：

hadoop中的hdfs实现底层是通过以下哪个选项实现的（）
- A、block的划分
- B、磁盘的copy
- C、数据的划分
- D、磁盘的分裂
正确答案:A
第14题：

saveAsText算子将数据集的元素以textfile的形式保存到HDFS文件系统或者其他支持的文件系统，对于每个元素，Spark将会调用toString方法，将它装换为文件中的文本

正确答案:正确
第15题：

Hadoop分布式文件系统（HDFS）具有（）的特性。
- A、适合数据批量处理
- B、数据处理能力极强
- C、最大化吞吐率
- D、允许计算向数据迁移
- E、适合多线程问题
正确答案:A,C,D
第16题：

Hive架构建立在Hadoop之上的，所有Hive中数据都是存储在HDFS中

正确答案:正确
第17题：

HDFS无法高效存储大量小文件，想让它能处理好小文件，比较可行的改进策略不包括（）.
- A、利用利用SequenceFile、MapFile、Har等方式归档小文件
- B、多Master设计
- C、Block大小适当调小
- D、调大namenode内存或将文件系统元数据存到硬盘里
正确答案:D
第18题：

单选题
下面关于Hadoop兼容性错误的是（）。
A
Flink能够支持Yarn，能够从HDFS和HBase中获取数据
B
能够使用所有的Hadoop的格式化输入和输出
C
能够使用Hadoop原有的Mappers和Reducers，但不能与Flink的操作混合使用
D
能够更快的运行Hadoop的作业

正确答案： A
解析：暂无解析
第19题：

单选题
关于Hive和Hadoop其他组件的关系，以下描述错误的是？（）
A
Hive最终将数据存储在HDFS中
B
HiveSQL其本质是执行MapReduce任务
C
Hive是Hadoop平台的数据仓库工具
D
Hive对HBase有强依赖

正确答案： B
解析：暂无解析
第20题：

判断题
Hadoop的NameNode用于存储文件系统的元数据。
A
对
B
错

正确答案：错
解析：暂无解析
第21题：

判断题
RDD可以从Hadoop兼容的文件系统生成，生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
A
对
B
错

正确答案：错
解析：暂无解析
第22题：

单选题
Hadoop中哪个模块负责HDFS的数据存储？（）
A
NameNode
B
DataNode
C
ZooKeeper
D
JobTraoker

正确答案： B
解析：暂无解析
第23题：

( 难度：中等)以下哪些命令可以查看hadoop中的文件大小
A.hdfs dfs -ls
B.hdfs dfs -cat
C.hdfs dfs -count
D.hdfs dfs -du

答案:ACD

saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下，可以使HDFS或者其他Hadoop支持的文件系统

题目

相似考题

参考答案和解析

更多“saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下，可以使HDFS或者其他Hadoop支持的文件系统”相关问题

相关内容