更多“saveAsText算子将数据集的元素以textfile的形式保存到HDFS文件系统或者其他支持的文件系统,对于每个元素,Spark将会调用toString方法,将它装换为文件中的文本”相关问题
  • 第1题:

    在Windows XP的“运行”对话框中,可使用convert命令将硬盘分区由FAT32文件系统转换为 ______文件系统。


    正确答案:NTFS
    NTFS

  • 第2题:

    假如你不能umount一个文件系统,可能由()原因引起

    • A、有用户登陆系统,并且该用户当前目录在该文件系统下
    • B、该文件系统忙
    • C、有该文件系统的目录树下挂接有其他的文件系统
    • D、一个进程正在调用该文件系统下的文件
    • E、该文件系统所在的卷处于打开状态

    正确答案:A,B,C,D

  • 第3题:

    创建rdd可以有如下几种?()

    • A、由外部存储系统的数据集创建,包括本地的文件系统
    • B、由一个已经存在的Scala集合创建
    • C、比如所有Hadoop支持的数据集,比如HDFS、Cassandra、Hbase
    • D、以上说法都不对

    正确答案:A,B,C

  • 第4题:

    网络文件系统的实现方法有挂载和()

    • A、链接
    • B、远程调用过程
    • C、网络通信
    • D、共享数据

    正确答案:B

  • 第5题:

    华为9000大数据解决方案的主要特点包括()。

    • A、集大数据存储、备份、分析为一体化
    • B、9000解决方案采用HDFS文件系统
    • C、支持多种接口与数据类型
    • D、用户可以根据不同的商业性能和容量的需求,灵活的配置不同节点的数量

    正确答案:A,C,D

  • 第6题:

    文件系统的安装必须调用()命令,把其他子系统安装到已经存在于文件系统的空闲节点上。文件系统类型的注册函数为(),超级用户卸载文件系统使用()命令。


    正确答案:mount;register filesystem;umount

  • 第7题:

    saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下,可以使HDFS或者其他Hadoop支持的文件系统


    正确答案:正确

  • 第8题:

    分布式文件系统HDFS主要由哪些功能模块构成()

    • A、客户端模块
    • B、数据划分模块
    • C、数据存储服务模块
    • D、元数据管理模块

    正确答案:A,C,D

  • 第9题:

    单选题
    以下对于HDFS描述不正确的是()。
    A

    HDFS是一个使用Java编写的分布式系统文件

    B

    HDFS由NameNode、DataNode、Client组成

    C

    HDFS不支持标准的POSIX文件系统接口

    D

    HDFS支持对已有的数据进行修改


    正确答案: B
    解析: 暂无解析

  • 第10题:

    填空题
    文件系统的安装必须调用()命令,把其他子系统安装到已经存在于文件系统的空闲节点上。文件系统类型的注册函数为(),超级用户卸载文件系统使用()命令。

    正确答案: mount,register filesystem,umount
    解析: 暂无解析

  • 第11题:

    判断题
    RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第12题:

    多选题
    分布式文件系统HDFS主要由哪些功能模块构成()。
    A

    客户端模块

    B

    元数据管理模块

    C

    数据存储服务模块

    D

    数据划分模块


    正确答案: C,A
    解析: 暂无解析

  • 第13题:

    下列选项中,正确描述Flume对数据源的支持的是?()

    A.只能使用HDFS数据源
    B.可以配置数据源
    C.不能使用文件系统
    D.不能使用目录方式


    B

  • 第14题:

    saveAsText算子将数据集的元素以textfile的形式保存到HDFS文件系统或者其他支持的文件系统,对于每个元素,Spark将会调用toString方法,将它装换为文件中的文本


    正确答案:正确

  • 第15题:

    spark读取hdfs数据是调用哪个技术实现的()

    • A、spark?core
    • B、spark?streaming
    • C、mapreduce
    • D、Grophx

    正确答案:C

  • 第16题:

    Linux需要一个文件系统,文件系统包含了预先定义的一组()以及文件,它们都保存到硬盘驱动器或者其他媒介之中,Linux内核将其挂载为()


    正确答案:系统目录树;根文件系统

  • 第17题:

    Windwos XP中可以将FAT32文件系统转换为NTFS文件系统的命令为()。

    • A、promt
    • B、convert
    • C、concert
    • D、config

    正确答案:B

  • 第18题:

    spark本身自带读取hdfs数据的方法


    正确答案:错误

  • 第19题:

    HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括().

    • A、利用利用SequenceFile、MapFile、Har等方式归档小文件
    • B、多Master设计
    • C、Block大小适当调小
    • D、调大namenode内存或将文件系统元数据存到硬盘里

    正确答案:D

  • 第20题:

    填空题
    Linux需要一个文件系统,文件系统包含了预先定义的一组()以及文件,它们都保存到硬盘驱动器或者其他媒介之中,Linux内核将其挂载为()

    正确答案: 系统目录树,根文件系统
    解析: 暂无解析

  • 第21题:

    单选题
    下面关于HDFS架构关键设计要点错误的是()。
    A

    支持回收站机制,以及副本数的动态设置机制

    B

    数据存储以数据块为单位,存储在操作系统的HDFS文件系统上

    C

    提供JAVAAPI,HTTP方式,SHELL方式访问HDFS数据

    D

    HDFS对外仅呈现多个统一的文件系统


    正确答案: A
    解析: 暂无解析

  • 第22题:

    问答题
    请阐述Region服务器向HDFS文件系统中读写数据的基本原理

    正确答案: Region服务器内部管理一系列Region对象和一个HLog文件,其中,HLog是磁盘上面的记录文件,它记录着所有的更新操作。每个Region对象又是由多个Store组成的,每个Store对象了表中的一个列族的存储。每个Store又包含了MemStore和若干个StoreFile,其中,MemStore是在内存中的缓存。
    解析: 暂无解析

  • 第23题:

    问答题
    试述HDFS中的块和普通文件系统中的块的区别。

    正确答案: 在传统的文件系统中,为了提高磁盘读写效率,一般以数据块为单位,恶如不是以字节为单位。
    HDFS中的块,默认一个块大小为64MB,而HDFS中的文件会被拆分成多个块,每个块作为独立的单元进行存储。HDFS在块的大小的设计上明显要大于普通文件系统。
    解析: 暂无解析

  • 第24题:

    ( 难度:中等)下列关于Hadoop API的说法正确的是
    A.Hadoop的文件API不是通用的,只用于HDFS文件系统
    B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的
    C.FileStatus对象存储文件和目录的元数据
    D.FSDataInputStream是javio.DataInputStream的子类

    答案:BCD