（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。A、SparkB、HiveC、HaystackD、HDFS

题目

（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。

A、Spark
B、Hive
C、Haystack
D、HDFS

相似考题

1.下列哪种场景不适用于Storm?()A.实时分析B.持续计算C.在线机器学习D.大量数据离线分析

2.海量数据存储与离线分析场景中,不会用到以下哪个组件?()A、CDMB、MapReduceC、FlinkD、HDFS

3.Apriori算法所面临的主要的挑战包括()。A 会消耗大量的内存B 会产生大量的候选项集C 对候选项集的支持度计算非常繁琐D 要对数据进行多次扫描

4.哪些机器学习算法不需要做归一化处理?

更多“（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。A、SparkB、HiveC、HaystackD、HDFS”相关问题

第1题：

Spark可以从()分布式文件系统中读取数据。

A.Tachyon
B.Hive
C.Hbase
D.HDFS

正确答案：ABCD
第2题：

以下并行框架哪些不适合大规模数据的迭代挖掘算法和图计算处理的

A.MapReduce
B.BSP
C.流式计算

参考答案：A,C
第3题：

在大数据相关技术中，（）是一个分布的、面向列的开源数据库，是一个适合于非结构化数据存储的数据库。

A.HBase
B.Map Reduce
C.ChukwA.D.HDFS

答案：A
解析：
本题考查的是大数据的关键技术。
HBase是一个分布试的、面向列的开源数据库，是一个适合于非结构化数据存储的数据库。
第4题：

spark的源码是由哪几种语言编写完成的（）
- A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
- B、spark为分布式数据集的处理提供了一个有效框架，并以高效的方式处理分布式数据集
- C、spark强调一站式解决方案，集批处理、实时流处理、交互式查询与图计算于一体，避免了多种运算场景下需要部署不同集群带来的资源浪费
- D、spark可以将数据分析过程的中间输出保存在内存中，从而不需要从外部持久化存储中反复读写数据，相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
正确答案:A,B
第5题：

基于机器学习的系统跟基于人工识别的系统有什么差异？（）
- A、机器学习系统节省人力，更自动化
- B、机器学习比较适合排序、简单逻辑判断
- C、机器学习比较适合复杂的聚类和分类算法
- D、机器学习可以从海量的数据中获取经验，而不受限于具体维度
正确答案:A,C,D
第6题：

数据结构与算法里，迭代法与分治法是算法的同一种操作手法

正确答案:错误
第7题：

下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是（）.
- A、FSDataInputStream扩展了DataInputStream以支持随机读
- B、为实现细粒度并行，输入分片应该越小越好
- C、一台机器可能被指派从输入文件的任意位置开始处理一个分片
- D、输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割
正确答案:B
第8题：

以下并行框架哪些不适合大规模数据的迭代挖掘算法和图计算处理的
- A、MapReduce
- B、BSP
- C、流式计算
正确答案:A,C
第9题：

判断题
数据结构与算法里，迭代法与分治法是算法的同一种操作手法
A
对
B
错

正确答案：对
解析：暂无解析
第10题：

单选题
至少由一种文档组成，并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合，称为（）。
A
数据库
B
记录
C
字段
D
文档

正确答案： A
解析：暂无解析
第11题：

单选题
在新零售时代，单维体验的商业模式中，在数据赋能方面做到极致，需要建立大数据云平台、持续迭代算法、（）、精准策略等方面的基础工作。
A
全息消费者画像
B
消费场景
C
信息采集
D
消费跟踪

正确答案： C
解析：暂无解析
第12题：

单选题
下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是（）.
A
FSDataInputStream扩展了DataInputStream以支持随机读
B
为实现细粒度并行，输入分片应该越小越好
C
一台机器可能被指派从输入文件的任意位置开始处理一个分片
D
输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割

正确答案： C
解析：暂无解析
第13题：

根据是否需要标注数据,机器学习方法可以分为有监督学习和无监督学习。监督学习中的训练集用于()

A、定量评价机器学习性能
B、估算模型
C、验证模型
D、定性评价机器学习性能

答案：B
第14题：

在大数据关键技术中，Hadoop的分布式文件系统HDFS属于大数据（）。

A.存储技术
B.分析技术
C.并行分析技术
D.挖掘技术

答案：A
解析：
教材P85，大数据关键技术，谷歌文件系统（GFS）和Hadoop的分布式文件系统HDFS奠定了大数据存储技术的基础。
第15题：

能源互联网中大数据批量数据处理系统是针对批量数据的处理系统，一般适用于先存储后计算、实时性要求不高、数据准确性和全面性比较重要的场景。（）

答案：对
解析：
略
第16题：

etl处理完成的数据可以存在以下哪些组件中（）
- A、hdfs
- B、hive
- C、hbase
- D、mapreduce
正确答案:A,B,C
第17题：

机器学习是一类从数据中自动分析获得规律，并且利用规律对未知数据进行预测的（）
- A、模式
- B、工具
- C、算法
- D、导向
正确答案:C
第18题：

至少由一种文档组成，并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合，称为（）。
- A、数据库
- B、记录
- C、字段
- D、文档
正确答案:A
第19题：

并行数据信号的特点有（）。
- A、并行数据传输比串行速度快
- B、并行数据传输需要多条线路同时传输
- C、并行数据信号更适合于远程传输
- D、并行传输需要多种电源驱动
正确答案:A,B
第20题：

机器学习就是通过算法，使得机器能从大量历史数据中学习规律，从而对新的样本做智能识别或对未来做预测。

正确答案:正确
第21题：

单选题
（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。
A
Spark
B
Hive
C
Haystack
D
HDFS

正确答案： B
解析：暂无解析
第22题：

多选题
以下并行框架哪些不适合大规模数据的迭代挖掘算法和图计算处理的
A
MapReduce
B
BSP
C
流式计算

正确答案： B,A
解析：暂无解析
第23题：

单选题
哪种场景适用于HDFS？（）
A
存储大量小文件
B
实时读取
C
需经常修改的数据
D
流式读取

正确答案： A
解析：暂无解析

（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。A、SparkB、HiveC、HaystackD、HDFS

题目

相似考题

更多“（）并行数据处理系统适用于需要多次操作特定数据集的场景，非常适合于机器学习中迭代算法的执行。A、SparkB、HiveC、HaystackD、HDFS”相关问题

相关内容