union算子对源RDD和参数RDD求并集后返回一个新的RDD
第1题:
A.zip
B.join
C.combineByKey
D.collect
第2题:
groupByKey算子在一个(K,V)的RDD上调用,返回一个(K,Iterator[V])的RDD
第3题:
以下属于spark启动后进程的是()
第4题:
mapPartitions算子类似于map,但独立地在RDD的每一个分片上运行,因此在类型为T的RDD上运行时,func的函数类型必须是Iterator[T]=>Iterator[U]
第5题:
interSection算子对源RDD和参数RDD求交集后返回一个新的RDD
第6题:
以下关于rdd的特性说法错误的是()
第7题:
join算子在类型为(K,V)和(K,W)的RDD上调用,返回一个相同key对应的所有元素对在一起的(K,(V,W))的RDD
第8题:
以下选项中是persist算子在源码中具有哪些参数的是()
第9题:
以下哪些是rdd的特性()
第10题:
filter算子返回一个新的RDD,该RDD由经过函数计算后返回值为true的输入元素组成
第11题:
调用RDD的Transformation算子可以立即发起job
NodeManager负责整个集群的资源统一调度和分配。
Yarn-client适合测试,Yarn-cluster适合生产。
Dataset具有RDD和DataFrame的优点,又避免它们的缺点。
第12题:
( 难度:中等)关于spark中RDD说法错误的是:
A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
C.宽依赖中会有shuffle的产生
D.窄依赖中会有shuffle的产生
答案:D
第13题:
A.VertexRDD
B.RDD[VertexId,VD]
C.RDD[Edge]
D.EdgeRDD
第14题:
reduceByKey算子在一个(K,V)的RDD上调用,返回一个(K,V)的RDD,使用指定的reduce函数,将相同key的值聚合到一起
第15题:
RDD可以转化为DataFrames,但是DataFrames不能转化为RDD
第16题:
count算子返回RDD的元素个数
第17题:
map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成
第18题:
以下关于rdd的说法中,正确的是哪些()
第19题:
spring中关于bean的说法正确的是()
第20题:
sortByKey算子在一个(K,V)的RDD上调用,K必须实现Ordered接口,返回一个按照key进行排序的(K,V)的RDD
第21题:
cogroup算子在类型为(K,V)和(K,W)的RDD上调用,返回一个(K,(Iterable
第22题:
distinct算子对源RDD进行去重后返回一个新的RDD
第23题:
对
错