当前分类: 大数据智能办公系统知识
问题:spark架构中支持以下哪些运行模式()A、基于standalone模式到的运行B、基于yarn的运行模式C、基于mesos模式的运行D、基于java的运行模式...
查看答案
问题:下面算子中哪个是宽依赖的()A、mapB、flatmapC、reducebykeyD、sample...
问题:以下哪个大小的消息,不可能是kafka的消息?()...
问题:函数可以作为其他函数的参数...
问题:在scala中定义方法使用关键字()A、defB、mainC、objectD、class...
问题:和spark中执行算子相对应的那个()A、jobB、taskC、driverD、stage...
问题:以下哪个不属于spark的生态圈()A、sparksqlB、sparkStreamingC、MLIBD、HIVE...
问题:storm和sparkstreaming最大的区别()A、科学统计支持B、是否具有schemaC、是否是真正的实时计算框架D、不同公司的产品...
问题:在大数据系统中的日志收集系统flume现在使用的版本是()A、OGB、NGC、MGD、BG...
问题:saveAsSequenceFile动作算子将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下,可以使HDFS或者其他Hadoop支持的文件系统...
问题:distinct算子对源RDD进行去重后返回一个新的RDD...
问题:foreach算子在数据集的每一个元素上,运行函数func进行操作...
问题:在scala语言中,关于类和它的伴生对象,说法不正确的是()...
问题:在scala中所有值类型的父类型是()A、AnyRefB、AnyValC、ObjectD、object...
问题:Spark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab...
问题:关于scala中的类和它的伴生对象,以下说法不正确的是()A、类和它的伴生对象定义在同一个文件中B、类和它的伴生对象可以有不同的名称C、类和它的伴生对象的名称必须相同D、类和它的伴生对象可以互相访问私有特性...
问题:flume在大数据生态圈中的作用是()A、监测收集数据B、处理数据C、计算数据D、存储数据...
问题:最开始Flume组件是哪个公司开发的()A、ClouderaB、阿里巴巴C、京东D、google...
问题:关于高阶函数描述错误的是:()A、在程序中应该首先被定义的函数B、将函数作为参数其他函数的参数使用C、执行时间长的函数D、函数的方法体比较长...
问题:groupByKey算子在一个(K,V)的RDD上调用,返回一个(K,Iterator[V])的RDD...