参考答案和解析
正确答案:错误
更多“Rdd不能够转换成DataFrame”相关问题
  • 第1题:

    GraphX中()是完整提供边的各种操作类。

    A.VertexRDD

    B.RDD[VertexId,VD]

    C.RDD[Edge]

    D.EdgeRDD


    正确答案:D

  • 第2题:

    groupByKey算子在一个(K,V)的RDD上调用,返回一个(K,Iterator[V])的RDD


    正确答案:正确

  • 第3题:

    SparkSQL的应运而生,它是将SparkSQL转换成RDD,然后提交到集群执行,执行效率非常快


    正确答案:正确

  • 第4题:

    dataFrame和RDD其实是一回事,没有区别


    正确答案:错误

  • 第5题:

    union算子对源RDD和参数RDD求并集后返回一个新的RDD


    正确答案:正确

  • 第6题:

    以下关于rdd的说法中,正确的是哪些()

    • A、rdd是由一系列partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,C,D

  • 第7题:

    DStream是一系列连续的RDD来表示。每个RDD含有一段时间间隔内的数据


    正确答案:正确

  • 第8题:

    cogroup算子在类型为(K,V)和(K,W)的RDD上调用,返回一个(K,(Iterable,Iterable))类型的RDD


    正确答案:正确

  • 第9题:

    DataFrame也支持嵌套数据类型(struct、array和map)


    正确答案:正确

  • 第10题:

    DataFrame和RDD最大的区别是什么()

    • A、科学统计支持
    • B、多了schema
    • C、存储方式不一样
    • D、外部数据源支持

    正确答案:B

  • 第11题:

    以下哪些不属于rdd特性()

    • A、冗余性
    • B、一致性
    • C、rdd之间具有依赖性
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B

  • 第12题:

    判断题
    RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第13题:

    GraphX中()是存放着Edg对象的RDD。

    A.VertexRDD

    B.RDD[VertexId,VD]

    C.RDD[Edge]

    D.EdgeRDD


    正确答案:C

  • 第14题:

    DataFrame也是一个分布式数据容器


    正确答案:正确

  • 第15题:

    RDD可以转化为DataFrames,但是DataFrames不能转化为RDD


    正确答案:错误

  • 第16题:

    interSection算子对源RDD和参数RDD求交集后返回一个新的RDD


    正确答案:正确

  • 第17题:

    以下关于rdd的特性说法错误的是()

    • A、rdd是仅仅由一组partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,B

  • 第18题:

    spring中关于bean的说法正确的是()

    • A、rdd是由一组partition够成的
    • B、rdd之间都是独立的,没有依赖
    • C、算子作用在partition上
    • D、每个rdd都会提供一批最优的计算位置

    正确答案:A,C,D

  • 第19题:

    与RDD类似,DataFrame也是一个分布式数据容器


    正确答案:正确

  • 第20题:

    DataFrame不能够转换成Rdd


    正确答案:错误

  • 第21题:

    filter算子返回一个新的RDD,该RDD由经过函数计算后返回值为true的输入元素组成


    正确答案:正确

  • 第22题:

    distinct算子对源RDD进行去重后返回一个新的RDD


    正确答案:正确

  • 第23题:

    多选题
    关于spark说法正确的是()。
    A

    调用RDD的Transformation算子可以立即发起job

    B

    NodeManager负责整个集群的资源统一调度和分配。

    C

    Yarn-client适合测试,Yarn-cluster适合生产。

    D

    Dataset具有RDD和DataFrame的优点,又避免它们的缺点。


    正确答案: A,C
    解析: 暂无解析

  • 第24题:

    ( 难度:中等)关于spark中RDD说法错误的是:
    A.宽依赖指的是多个子RDD的分区会依赖同一个父RDD的分区,关系是一对多
    B.窄依赖指的是每一个父RDD的分区最多被子RDD的一个分区使用,是一对一的
    C.宽依赖中会有shuffle的产生
    D.窄依赖中会有shuffle的产生

    答案:D