当前分类: 大数据智能办公系统知识
问题:spark在基于客户端模式运行时,driver会在一台机器指定启动...
查看答案
问题:使用scala语言编写的源程序时的文件扩展名是:(.scala)...
问题:spark架构中的rdd相当于java中的()概念A、类B、接口C、方法D、内部类...
问题:当我们在scala语言中书写for循环块用到的关键字to与until说法正确的是()A、to:左闭右闭循环体中包括左边与右边的数值B、until:左闭右开循环体中包括左边的数值,不包括右边的数值C、until和to的不同之处在于不包括最后一个元素。D、to与until用法一致,包括循环次数也一样...
问题:kafka适用场景(能解决的问题)()A、解耦B、扩展性C、冗余D、分解峰值压力...
问题:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用...
问题:在scala中添加方法的返回值为空应该使用哪个关键字()...
问题:sparkjob默认的调度模式是()...
问题:zookeeper只有一种数据模型...
问题:现有元组valt=(1,3.14,"Fred"),关于元组t的说法错误的是?()A、t._0?等于1B、t的类型为Tuple3[Int,Double,java.lang.String]C、val(first,second,_)=t?//second等于3.14D、t._0无法访问,会抛出异常...
问题:spark架构中算子的分类包含以下哪些算子()A、cache算子是persist算子的一个子集B、persist算子是cache算子的一个子集C、persist算子包含cache算子D、cache算子包含persist算子...
问题:spark切分完的partition的数量和block一致的...
问题:Spark可以使用Hadoop的YARN和ApacheMesos作为它的资源管理和调度器,并且可以处理所有Hadoop支持的数据,包括HDFS、HBase和Cassandra等...
问题:flume是个什么系统?()A、消息中间件B、日志收集系统C、缓冲组件D、反向代理...
问题:for循环中的yield会把当前的元素记下来,保存在集合中...
问题:storm系统和spark?streaming系统最大的区别是哪个?(?)()A、科学统计支持B、是否具有schemaC、是否是真正的实时计算框架D、不同公司的产品...
问题:Flume现在使用的是哪个版本()A、NG版本B、OG版本C、DG版本D、MG版本...
问题:flume架构中的sink组纪检能够将数据存储到hbase中...
问题:以下组件哪个不是Flume的组成部分()A、sourceB、sinkC、channelD、topic...
问题:以下关于List的定义。正确的是?()...