A.大数据魔镜
B.D3
C.GoogleChartAPI
D.GoogleFusionTables
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
A.信息图表
B.地图工具
C.时间线工具
D.分析工具
20春学期(1709、1803、1809、1903、1909、2003)大数据开发技术(一)在线作业试卷总分:100 得分:100一、单选题 (共 30 道试题,共 60 分)1.Modest Maps是哪种可视化工具()A.信息图表B.地图工具C.时间线工具D.分析工具答案:B2.UMP系统借助于()来实现分布式数据库服务A.MnesiaB.LVSC.RabbitMQD.Zookeeper答案:A3.Hbase中采用()保证系统出错时及时恢复A.MemStoreB.HlogC.StoreFileD.客户端答案:B4.以下亚马逊的产品中哪个是数据仓库A.ElastiCacheB.RDSC.DynamoDBD.Redshift答案:D5.HDFS中ClientProtocal的()方法可以查找下一个数据块A.getBlockB.getBlockLocationsC.getLocationD.nextBlock答案:B6.对于不同顶点之间的信息交换,Pregel采用了()A.远程数据读取B.共享内存C.纯消息传递模型D.共享消息答案:C7.UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障恢复、备份、迁移、扩容等功能A.Controller服务器B.Procy服务器C.愚公系统D.Agent服务器答案:A8.批处理系统关注(),流处理系统关注()。A.吞吐率,延时B.延时,吞吐率C.延时,速度D.速度,吞吐率答案:A9.()是一个通用文件系统的抽象基类,可以被分布式文件系统继承A.DistributedFileSystemB.GFSSystemC.FileSystemD.HDFSSystem答案:C10.UMP系通过()来实现实现在不停机的情况下动态扩容、缩容和迁移A.Controller服务器B.Procy服务器C.愚公系统D.Agent服务器答案:C11.列式数据库采用()存储模型A.NSMB.DSMC.HbaseD.MySQL答案:B12.应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()A.列族数据库B.键值数据库C.图数据库D.文档数据库答案:B13.UMP系统借助于()来实现高效和可靠的协同工作A.MnesiaB.LVSC.RabbitMQD.Zookeeper答案:D14.UMP系统中面对分库分表用户如何进行资源调度()A.可以共享同一个MySQL实例B.每个用户独占一个MySQL实例C.会占用多个独立的MySQL实例D.随机分配MySQL实例答案:C15.Storm中如果要让每一个Task都会收到所有的Tuple,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping答案:B16.关于Hadoop集群网络拓扑,以下说法错误的是()。A.普通的Hadoop集群结构由一个两阶网络构成B.Hadoop集群中每个机架有30-40个服务器,配置一个1GB的交换机,并向上传输到一个核心交换机或者路由器C.在相同的机架中的节点间的带宽的总和,要等于不同机架间的节点间的带宽总和D.一般来说机架内部网络环境比机架间网络环境好答案:C17.Gephi是哪种可视化工具()A.信息图表B.地图工具C.时间线工具D.分析工具答案:D18.MapReduce设计的一个理念就是(),因为移动数据需要大量的网络传输开销。A.数据向计算靠拢B.计算向数据靠拢C.计算向网络靠拢D.计算与数据并行答案:B19.Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping答案:C20.以下哪个是HDFS的局限性()。A.吞吐率B.数据集C.兼容性D.延迟答案:D21.HBase的客户端并不依赖Master,而是通过()来获得Region位置信息,大多数客户端甚至从来不和Master通信,这种设计方式使得Master负载很小A.MasterB.RegionC.ZookeeperD.Chubby答案:C22.优点是性能好(高并发),灵活性高,复杂性低,数据结构灵活 提供嵌入式文档功能的数据库是()A.列族数据库B.键值数据库C.图数据库D.文档数据库答案:D23.MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给JobTracker,同时接收JobTracker 发送过来的命令并执行相应的操作。A.ClientB.Job TrackerC.TaskD.Task Tracker答案:D24.Storm中如果要随机分发Stream中的Tuple,保证每个Bolt的Task接收Tuple数量大致一致,应该采用哪种Stream Groupings()。A.ShuffleGroupingB.AllGroupingC.GlobalGroupingD.FiedlsGrouping答案:A25.Hbase中主服务器Master主要负责表和Region的管理工作A.MasterB.SlaverC.RegionD.客户端答案:C26.以下哪个是通过JDBS和关系数据库进行交互的()。A.AmbariB.OozieC.HiveD.Sqoop答案:D27.UMP系通过()来实现实现管理每台物理机上的MySQL实例A.Controller服务器B.Procy服务器C.愚公系统D.Agent服务器答案:D28.()可解决HDFS中名称节点运行期间EditLog不断变大的问题A.NameNodeB.SecondaryNameNodeC.DataNodeD.Block答案:B29.Hbase中Zookeeper可以帮助选举出一个()作为集群的总管A.MasterB.SlaverC.RegionD.客户端答案:A30.Pregel计算模型以()作为输入A.有向图B.无向图C.矢量图D.树答案:A二、多选题 (共 10 道试题,共 20 分)31.以下哪个不是云数据库的特点A.高可扩展性B.高可用性C.支持资源有效分发D.本地存储答案:D32.以下哪些属于典型的大数据应用()。A.谷歌搜索B.谷歌流感趋势C.谷歌统计D.纸牌屋制作E.黑镜子制作答案:BD33.MapReduce可以解决哪些计算问题()。A.矩阵乘法B.关系代数运算C.聚合运算D.关系投影运算答案:ABCD34.流计算系统的需求有()。A.实时性B.廉价C.高性能D.高带宽E.分布式答案:ACE35.以下属于Hadoop的安装方式的有()。A.单机模式B.多机模式C.分布式模式D.并行模式E.伪分布式模式答案:ACE36.已得到广泛应用的分布式文件系统主要包括()。A.GFSB.MapReduceC.HbaseD.HDFS答案:AD37.Hbase中Zookeeper提供了()A.分布式同步B.组服务C.域名服务D.配置维护答案:AB