当前分类: 大数据智能办公系统知识
问题:spark在进行数据切分的时候,决定了partition的哪些属性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置...
查看答案
问题:对于元组valt=(1,3.14,"Fred")说法不正确的是?()A、t._0等于1B、t的类型为Tuple3[Int,Double,java.lang.String]C、val(first,second,_)=t//second等于3.14D、t._0无法访问,会抛出异常...
问题:spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致...
问题:spark中的rdd不存储数据,存储的是()A、业务逻辑B、物理数据C、数据库数据D、物理逻辑...
问题:以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置...
问题:对于以下2个列表的操作,那些说法说法不正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(1,2,3,4,5)...
问题:spark为分布式数据集的处理提供了一个有效框架,并以高效的方式...
问题:spark中的图计算框架是()...
问题:zookeeper数据模型是带有默认权限的...
问题:以下有返回值的函数有哪些()A、mapB、flatMapC、foreachD、filter...
问题:scala中的Object中通常在里面放一些静态的()A、FieldB、MethodC、管理块服务器D、Source...
问题:元组和Map集合没有区别...
问题:maven加载jar包是通过pom.xml文件中的groupId,artifactId,version来进行jar包查找的...
问题:以下哪个算子是懒执行的()A、mapB、foreachC、countD、reduce...
问题:SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD...
问题:standalone组件在spark中的角色是其自带的()A、任务调度框架B、任务模式C、资源调度框架D、任务整合...
问题:下列关于Scala对于异常的处理处理正确的是:()A、Case匹配的方式处B、Throw出去C、抛插值器D、singleton=false...
问题:hadoop和spark的都是并行计算,两者都是用mr模型来进行...
问题:spark本身自带读取hdfs数据的方法...
问题:只有主构造函数才可以写参数...