MapReduce计算文件词频的例子中描述不正确的是A．包括了Split，Map，Shuffle，Reduce几个过程。在计算过程中数据始终以键值对的形式存在。B．Split就是将输入文件中的内容按行分割为key和value的形式。Map阶段对每块的每一个单词为key，单词个数作为value排序进行输出。C．在Shuffle阶段，会对map的输出按照key进行合并和排序。D．Reduce的过程将所属key下的value进行了叠加，计算出单词key的次数。

题目

MapReduce计算文件词频的例子中描述不正确的是

A．包括了Split，Map，Shuffle，Reduce几个过程。在计算过程中数据始终以键值对的形式存在。

B．Split就是将输入文件中的内容按行分割为key和value的形式。Map阶段对每块的每一个单词为key，单词个数作为value排序进行输出。

C．在Shuffle阶段，会对map的输出按照key进行合并和排序。

D．Reduce的过程将所属key下的value进行了叠加，计算出单词key的次数。

相似考题

1.MapReduce与传统并行计算框架的对比中,说法正确的是()。A.MapReduce属于共享式集群架构，容错性好B.传统并行计算框架比MapReduce硬件更加便宜C.传统并行计算框架适用于实时、细粒度计算D.MapReduce适用于数据密集型，传统并行计算框架适用于计算密集型

2.下列关于MapReduce说法不正确的是( )。A.MapReduce是一种计算框架B.MapReduce来源于google的学术论文C.MapReduce程序只能用java语言编写D.MapReduce隐藏了并行计算的细节，方便使用

3.有关MapReduce的输入输出,说法错误的是()A.链接多个MapReduce作业时，序列文件是首选格式B.FileInputFormat中实现的getSplits()可以把输入数据划分为分片，分片数目和大小任意定义C.想完全禁止输出，可以使用NullOutputFormatD.每个reduce需将它的输出写入自己的文件中，输出无需分片

4.在Windows中,关于文件夹的描述不正确的是() 。A. 文件夹中可以存放驱动程序文件B. 同一文件夹中可以存放两个同名文件C. 文件夹是用来组织和管理文件的D. “计算机”是一个系统文件夹

更多“MapReduce计算文件词频的例子中描述不正确的是”相关问题

第1题：

下列关于对安全评价过程控制体系文件中的程序文件的描述，不正确的是（）。

正确答案：B
第2题：

下面例子中，哪个例子是描述性研究的最好例子（）
A企业调查
B农村调查
C经济调查
D人口普查

D
略
第3题：

spark架构计算速度比mapreduce计算速度快单纯因为内存

正确答案:错误
第4题：

在Bigtable中，（）主要用来存储子表数据以及一些日志文件
- A、GFS
- B、Chubby
- C、SSTable
- D、MapReduce
正确答案:A
第5题：

mapreduce是基于（）运行的计算框架
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:B
第6题：

在MapReduce编程模式中，Map任务的输入是（）？
- A、一个或多个文件块
- B、由文件块转换的键值表对
- C、文件系统中一篇文档
- D、数据库中一条元组
正确答案:A
第7题：

MapReduce是一个什么类型的并行计算系统？
- A、专门为MPI设计的系统
- B、图计算
- C、流计算
- D、作业批处理
正确答案:D
第8题：

单选题
关于MapReduce的描述，错误的是（）。
A
易于编程
B
良好的扩展性
C
实时计算
D
高容错性

正确答案： D
解析：暂无解析
第9题：

判断题
MapReduce设计的一个理念是“数据向计算靠拢”
A
对
B
错

正确答案：错
解析：暂无解析
第10题：

单选题
MapReduce适合做下列哪项（）。
A
迭代计算
B
离线计算
C
实时交互计算
D
流式计算

正确答案： B
解析：暂无解析
第11题：

问答题
MapReduce适合做哪些计算？

正确答案： MapReduce计算模型对于高性能要求的应用以及平行计算领域的需求非常适合。对于大量数据要做同样的计算的时候，就可以把数据进行划分，然后分配到不同的机器上来分别作计算。
解析：暂无解析
第12题：

单选题
MapReduce中默认把输入文件按照多少MB来划分？
A
16
B
32
C
64
D
128

正确答案： C
解析：暂无解析
第13题：

MapReduce中默认把输入文件按照多少MB来划分?

A.16
B.32
C.64
D.128

参考答案：C
第14题：

MapReduce是一种编程模型，用于大规模数据集的并行运算，可以非常好的和云计算相结合以处理海量数据计算。MapReduce的设计目标包括以下哪些项？（）
- A、实时性
- B、高容错性
- C、易于扩展
- D、易于编程
正确答案:B,C,D
第15题：

与spark基于内存相比，mapreduce是基于（）运行的计算框架
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:B
第16题：

hadoop中的mapreduce是基于什么运行的计算框架（）
- A、内存
- B、磁盘
- C、内存加磁盘
- D、网络
正确答案:B
第17题：

有关MapReduce的输入输出，说法错误的是（）.
- A、链接多个MapReduce作业时，序列文件是首选格式
- B、把输入数据划分为分片，分片数目和大小任意定义
- C、想完全禁止输出，可以使用Null Output Format
- D、每个reduce需将它的输出写入自己的文件中，输出无需分片
正确答案:B
第18题：

MapReduce中默认把输入文件按照多少MB来划分？
- A、16
- B、32
- C、64
- D、128
正确答案:C
第19题：

问答题
请描述在YARN框架中执行一个MapReduce程序时，从提交到完成需要经历的具体步骤。

正确答案： ①用户编写客户端应用程序，向YARN提交应用程序，提交的内容包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等。
②YARN中的ResourceManager负责接收和处理来自客户端的请求。接到客户端应用程序请求后，ResourceManager里面的调度器会为应用程序分配一个容器。同时，ResourceManager的应用程序管理器会与该容器所在的NodeManager通信，为该应用程序在该容器中启动一个ApplicationMaster。
③ApplicationMaster被创建后会首先向ResourceManager注册，从而使得用户可以通过ResourceManager来直接查看应用程序的运行状态。
④ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请资源。
⑤ResourceManager以“容器”的形式向提出申请的ApplicationMaster分配资源，一旦ApplicationMaster申请到资源后，就会与该容器所在的NodeManager进行通信，要求它启动任务。
⑥当ApplicationMaster要求容器启动任务时，它会为任务设置好运行环境（包括环境变量、JAR包、二进制程序等），然后将任务启动命令写到一个脚本中，最后通过在容器中运行该脚本来启动任务。
⑦各个任务通过某个RPC协议向ApplicationMaster汇报自己的状态和进度，让ApplicationMaster可以随时掌握各个任务的运行状态，从而可以在任务失败时重启任务。
⑧应用程序运行完成后，ApplicationMaster向ResourceManager的应用程序管理器注销并关闭自己。若ApplicationMaster因故失败，ResourceManager中的应用程序管理器会监测到失败的情形，然后将其重新启动，直到所有任务执行完毕。
解析：暂无解析
第20题：

单选题
MapReduce是一个什么类型的并行计算系统？
A
专门为MPI设计的系统
B
图计算
C
流计算
D
作业批处理

正确答案： B
解析：暂无解析
第21题：

单选题
下面例子中，哪个例子是描述性研究的最好例子（）
A
企业调查
B
农村调查
C
经济调查
D
人口普查

正确答案： A
解析：暂无解析
第22题：

单选题
有关MapReduce的输入输出，说法错误的是（）.
A
链接多个MapReduce作业时，序列文件是首选格式
B
把输入数据划分为分片，分片数目和大小任意定义
C
想完全禁止输出，可以使用Null Output Format
D
每个reduce需将它的输出写入自己的文件中，输出无需分片

正确答案： C
解析：暂无解析
第23题：

单选题
Hadoop中MapReduce组件擅长处理哪种场景的计算任务？（）
A
迭代计算
B
离线计算
C
实时交互计算
D
流式计算

正确答案： C
解析：暂无解析
第24题：

单选题
在MapReduce编程模式中，Map任务的输入是（）？
A
一个或多个文件块
B
由文件块转换的键值表对
C
文件系统中一篇文档
D
数据库中一条元组

正确答案： C
解析：暂无解析

题目

相似考题

更多“MapReduce计算文件词频的例子中描述不正确的是”相关问题

相关内容