spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集
第1题:
以下关于sparkstreaming说法正确的是()
第2题:
spark中的rdd是一个()数据集
第3题:
spark支持的分布式部署方式中哪个是错误的()
第4题:
spark可以编写sql脚本的框架是()
第5题:
spark框架中,整合机器学习库,并对外提供接口的框架是()
第6题:
Spark提供了统一的解决方案。Spark可以用于批处理、交互式查询(SparkSQL)、实时流处理(SparkStreaming)、机器学习(SparkMLlib)和图计算(GraphX)
第7题:
RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
第8题:
SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型
第9题:
对传统的分布式程序设计相比,Mapreduce封装了()等细节,还提供了一个简单而强大的接口。
第10题:
Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。
第11题:
第12题:
为解决气象数据处理服务的
用于移动通讯服务的
只为一个集团提供通讯服务的
将网络资源集中管理和调度,并以虚拟化方式为用户提供服务的
第13题:
spark中弹性分布式数据集指的是哪个()
第14题:
spark中的弹性分布式数据集相当于java中的()概念
第15题:
spark的源码是由哪几种语言编写完成的()
第16题:
spark中可以整合机器学习库,并可以对外提供接口的框架是()
第17题:
spark的核心框架是()
第18题:
下面对于spark的特点描述正确的是()
第19题:
SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用
第20题:
云计算是()。
第21题:
大数据处理框架-Spark诞生于()
第22题:
对
错
第23题:
对
错