参考答案和解析
正确答案:正确
更多“saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下,可以使HDFS或者其他Hadoop支持的文件系统”相关问题
  • 第1题:

    在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据( )。

    A.存储技术
    B.分析技术
    C.并行分析技术
    D.挖掘技术

    答案:A
    解析:
    教材P85,大数据关键技术,谷歌文件系统(GFS)和Hadoop的分布式文件系统HDFS奠定了大数据存储技术的基础。

  • 第2题:

    关于数据备份说法错误的是()

    • A、将数据备份到文件时,必须指定文件要保存的名称和位置
    • B、备份文件可以保存到硬盘、软盘或任何其他可以保存文件的可移动或不可移动媒体
    • C、将数据备份到磁带时,计算机必须接有磁带设备
    • D、备份工具支持使用CD-RW(可重写光盘)和CD-R(可读写光盘)

    正确答案:D

  • 第3题:

    创建rdd可以有如下几种?()

    • A、由外部存储系统的数据集创建,包括本地的文件系统
    • B、由一个已经存在的Scala集合创建
    • C、比如所有Hadoop支持的数据集,比如HDFS、Cassandra、Hbase
    • D、以上说法都不对

    正确答案:A,B,C

  • 第4题:

    Hive?是建立在Hadoop?之上的,所有?Hive?的数据都是存储在HDFS?中的


    正确答案:正确

  • 第5题:

    Spark可以使用Hadoop的YARN和ApacheMesos作为它的资源管理和调度器,并且可以处理所有Hadoop支持的数据,包括HDFS、HBase和Cassandra等


    正确答案:正确

  • 第6题:

    分布式文件系统HDFS主要由哪些功能模块构成()

    • A、客户端模块
    • B、数据划分模块
    • C、数据存储服务模块
    • D、元数据管理模块

    正确答案:A,C,D

  • 第7题:

    单选题
    下面关于HDFS架构关键设计要点错误的是()。
    A

    支持回收站机制,以及副本数的动态设置机制

    B

    数据存储以数据块为单位,存储在操作系统的HDFS文件系统上

    C

    提供JAVAAPI,HTTP方式,SHELL方式访问HDFS数据

    D

    HDFS对外仅呈现多个统一的文件系统


    正确答案: A
    解析: 暂无解析

  • 第8题:

    多选题
    Hadoop分布式文件系统(HDFS)具有()的特性。
    A

    适合数据批量处理

    B

    数据处理能力极强

    C

    最大化吞吐率

    D

    允许计算向数据迁移

    E

    适合多线程问题


    正确答案: E,C
    解析: 暂无解析

  • 第9题:

    单选题
    关于数据备份说法错误的是()
    A

    将数据备份到文件时,必须指定文件要保存的名称和位置

    B

    备份文件可以保存到硬盘、软盘或任何其他可以保存文件的可移动或不可移动媒体

    C

    将数据备份到磁带时,计算机必须接有磁带设备

    D

    备份工具支持使用CD-RW(可重写光盘)和CD-R(可读写光盘)


    正确答案: C
    解析: 暂无解析

  • 第10题:

    多选题
    Hadoop的HDFS是一种分布式文件系统,适合以下哪种场景的数据存储和管理?()
    A

    大量小文件存储

    B

    高容错,高吞吐量

    C

    低延迟读取

    D

    流式数据访问


    正确答案: D,B
    解析: 暂无解析

  • 第11题:

    (难度:中等)可以使用Flume将MySQL中的数据写入hdfs中

    答案:(yes)

  • 第12题:

    ( 难度:中等)下列关于Hadoop API的说法正确的是
    A.Hadoop的文件API不是通用的,只用于HDFS文件系统
    B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的
    C.FileStatus对象存储文件和目录的元数据
    D.FSDataInputStream是javio.DataInputStream的子类

    答案:BCD

  • 第13题:

    hadoop中的hdfs实现底层是通过以下哪个选项实现的()

    • A、block的划分
    • B、磁盘的copy
    • C、数据的划分
    • D、磁盘的分裂

    正确答案:A

  • 第14题:

    saveAsText算子将数据集的元素以textfile的形式保存到HDFS文件系统或者其他支持的文件系统,对于每个元素,Spark将会调用toString方法,将它装换为文件中的文本


    正确答案:正确

  • 第15题:

    Hadoop分布式文件系统(HDFS)具有()的特性。

    • A、适合数据批量处理
    • B、数据处理能力极强
    • C、最大化吞吐率
    • D、允许计算向数据迁移
    • E、适合多线程问题

    正确答案:A,C,D

  • 第16题:

    Hive架构建立在Hadoop之上的,所有Hive中数据都是存储在HDFS中


    正确答案:正确

  • 第17题:

    HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括().

    • A、利用利用SequenceFile、MapFile、Har等方式归档小文件
    • B、多Master设计
    • C、Block大小适当调小
    • D、调大namenode内存或将文件系统元数据存到硬盘里

    正确答案:D

  • 第18题:

    单选题
    下面关于Hadoop兼容性错误的是()。
    A

    Flink能够支持Yarn,能够从HDFS和HBase中获取数据

    B

    能够使用所有的Hadoop的格式化输入和输出

    C

    能够使用Hadoop原有的Mappers和Reducers,但不能与Flink的操作混合使用

    D

    能够更快的运行Hadoop的作业


    正确答案: A
    解析: 暂无解析

  • 第19题:

    单选题
    关于Hive和Hadoop其他组件的关系,以下描述错误的是?()
    A

    Hive最终将数据存储在HDFS中

    B

    HiveSQL其本质是执行MapReduce任务

    C

    Hive是Hadoop平台的数据仓库工具

    D

    Hive对HBase有强依赖


    正确答案: B
    解析: 暂无解析

  • 第20题:

    判断题
    Hadoop的NameNode用于存储文件系统的元数据。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第21题:

    判断题
    RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第22题:

    单选题
    Hadoop中哪个模块负责HDFS的数据存储?()
    A

    NameNode

    B

    DataNode

    C

    ZooKeeper

    D

    JobTraoker


    正确答案: B
    解析: 暂无解析

  • 第23题:

    ( 难度:中等)以下哪些命令可以查看hadoop中的文件大小
    A.hdfs dfs -ls
    B.hdfs dfs -cat
    C.hdfs dfs -count
    D.hdfs dfs -du

    答案:ACD