当前分类: 大数据智能办公系统知识
问题:spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理()数据集A、单机B、集中式C、分布式D、NOSQL...
查看答案
问题:flume在大数据架构中的作用是()A、监测收集数据B、处理数据C、计算数据D、存储数据...
问题:spark本身能够读取到hdfs中的数据...
问题:下面隐式转化输出结果为objectTest5{defadd(i:Int)(implicity:Int=100):Int=i+ydefmain(args:Array[String]):Unit={varadd2=add(2);println(add2)}}()A、5B、102C、103D、105...
问题:关于Scala中不支持多重继承的原因描述正确的是?()A、在实际使用中,真正必须使用多重继承的时机很少。B、若多重继承的两个基类具有相同的字段或方法,就会引发菱形继承问题,造成问题的复杂性。C、通过使用Trait可以达到多重继承的类似效果。D、以上均正确。...
问题:大数据计算原则是()A、延迟加载B、不能立即接action算子C、立即执行D、需要action算子触发...
问题:对于以下2个列表的操作,那些说法说法不正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(1,2,3,4,5)...
问题:下列关于Scala对于异常的处理处理正确的是:()A、Case匹配的方式处B、Throw出去C、抛插值器D、singleton=false...
问题:只有主构造函数才可以写参数...
问题:spark中的图计算框架是()...
问题:以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置...
问题:SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD...
问题:spark支持的分布式部署方式中哪个是错误的()A、standaloneB、spark on mesosC、spark on YARND、spark on local...
问题:flume架构中的sink组纪检能够将数据存储到hbase中...
问题:spark中的rdd不存储数据,存储的是()A、业务逻辑B、物理数据C、数据库数据D、物理逻辑...
问题:以下有返回值的函数有哪些()A、mapB、flatMapC、foreachD、filter...
问题:Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性...
问题:linux中ls可以查看当前目录下的文件结构...
问题:zookeeper数据模型是带有默认权限的...