spark在进行数据切分的时候,决定了partition的哪些属性()
第1题:
spark中的rdd是一个()数据集
第2题:
spark在进行数据切分的时候,下列哪些属性和partition划分有关()
第3题:
以下关于rdd的说法中,正确的是哪些()
第4题:
spring中关于bean的说法正确的是()
第5题:
DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据
第6题:
rdd是spark中个哪个架构提出的概念()
第7题:
RDD特性包含如下哪些?()
第8题:
spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致
第9题:
RDD(ResilientDistributedDataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
第10题:
spark中的rdd不存储数据,存储的是()
第11题:
对
错
第12题:
( 难度:中等)关于spark中RDD说法错误的是:
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生
答案:D
第13题:
spark中以下哪些特性是rdd的特性()
第14题:
以下关于rdd的特性说法错误的是()
第15题:
以下选项属于rdd特性的是()
第16题:
Spark中,以下哪些是rdd的特性()
第17题:
以下选项中是persist算子在源码中具有哪些参数的是()
第18题:
描述Spark集群计算中RDD的含义和作用。
第19题:
spark中的rdd相当于java中的()概念
第20题:
spark框架中,机器学习库的框架是哪个()
第21题:
以下哪些不属于rdd特性()
第22题:
SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型
第23题: