spark中的rdd是一个()数据集
第1题:
spark中弹性分布式数据集指的是哪个()
第2题:
spark中的弹性分布式数据集相当于java中的()概念
第3题:
spark的源码是由哪几种语言编写完成的()
第4题:
描述Spark集群计算中RDD的含义和作用。
第5题:
RDD特性包含如下哪些?()
第6题:
RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
第7题:
SparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用
第8题:
spark中的rdd不存储数据,存储的是()
第9题:
下列不属于Google云计算平台技术架构的是()
第10题:
对
错
第11题:
RDD是一个只读的,可分区的分布式数据集。
RDD默认存储在磁盘,当磁盘不足时,溢写到内存。
RDD数据以分区的形式在集群中存储。
RDD具有血统机制,发生数据丢失时,可快速进行数据恢复。
第12题:
第13题:
spark中以下哪些特性是rdd的特性()
第14题:
spark在进行数据切分的时候,决定了partition的哪些属性()
第15题:
rdd是spark中个哪个架构提出的概念()
第16题:
与RDD类似,DataFrame也是一个分布式数据容器
第17题:
spark框架中,机器学习库的框架是哪个()
第18题:
worker组件在spark的任务调度中具有以下哪个作用()
第19题:
spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集
第20题:
SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型
第21题:
第22题:
并行数据处理MapReduce
分布式锁Chubby
结构化数据表BigTable
弹性云计算EC2
第23题:
对
错