最后,为解决数据中心数据更新与同步问题,张总安排总部的系统分析师李工来设计方案,并指出可以对王副总工的意见加以完善,如果需要也可以修改各地的业务系统。李工提出的方案具有较好的可执行性,并获得了大家的认可。请用400字以内文字叙述系统分析师李工的方案要点。

题目

最后,为解决数据中心数据更新与同步问题,张总安排总部的系统分析师李工来设计方案,并指出可以对王副总工的意见加以完善,如果需要也可以修改各地的业务系统。李工提出的方案具有较好的可执行性,并获得了大家的认可。请用400字以内文字叙述系统分析师李工的方案要点。


相似考题
更多“最后,为解决数据中心数据更新与同步问题,张总安排总部的系统分析师李工来设计方案,并指出可以对 ”相关问题
  • 第1题:

    阅读以下关于数据库分析与建模的叙述,在答题纸上回答问题1至问题 3。 【说明】 某电子商务企业随着业务不断发展,销售订单不断增加,每月订单超过了50万笔,急需开发一套新的互联网电子订单系统。同时该电商希望建立相应的数据中心,能够对订单数据进行分析挖掘,以便更好地服务用户。 王工负责订单系统的数据库设计与开发,初步设计的核心订单关系模式为: orders(order_no,customer_no ,order_date,product_no,price,......); 考虑订单数据过多,单一表的设计会对系统性能产生较大影响,仅仅采用索引不足以解决性能问题。因此,需要将订单表拆分,按月存储。 王工采用反规范化设计方法来解决,给出了相应的解决方案。李工负责数据中心的设计与开发。李工认为王工的解决方案存在问题,建议采用数据物理分区技术。在解决性能问题的同时,也为后续的数据迁移、数据挖掘和分析等工作提供支持。

    【问题 1】 (8分) 常见的反规范化设计包括增加冗余列、增加派生列、重新组表和表分割。为解决题干所述需求,王工采用的是哪种方法?请用300字以内的文字解释说明该方法,并指出其优缺点。 【问题2】 (8 分) 物理数据分区技术一般分为水平分区和垂直分区,数据库中常见的是水平分区。水平分区分为范围分区、哈希分区、列表分区等。请阅读下表,在(1)~(8) 中填写不同分区方法在数据值、数据管理能力、实施难度与可维护性、数据分布等方面的特点。【问题 3】(9 分) 根据需求,李工宜选择物理水平分区中的哪种分区方法?请用300字以内的文字分别解释说明该方法的优缺点。


    正确答案:问题1
    王工采用的是表分割的方式进行反规范化设计。
    表分割包括水平分割与垂直分割两种形式:
    水平分割:根据一列或多列数据的值把数据行放到两个独立的表中。
    垂直分割:把主码和一些列放到一个表,然后把主码和另外的列放到另一个表中。
    问题2
    (1)连续(2)离散(3)弱(4)强(5)好(6)好(7)不均匀(8)均匀
    问题3
    李工宜选择范围分区方式。
    范围分区优点包括:实现容易、数据管理能力强、提高查询效果、利于维护如备份恢复时间都可缩短、利于做过期过处理。
    范围分区缺点包括:数据分布不均匀所以可以与哈希分区组合应用。

  • 第2题:

    阅读以下关于企业数据中心设计的说明,回答问题1至问题3。

    某企业计划建设一个企业数据中心,该数据中心支持A、B、C。D和E5项业务,各业务完全独立运行,各项业务运行的操作系统均不相同。在单台某型服务器上,除了为系统开销预留30%的CPU占用率之外,各业务在繁忙时段(白天)及非繁忙时段(夜间)的CPU占用率如下表所示。

    现该企业拟全部采用该类型服务器,张工和李工据此提出了不同的设计方案。张工认为需要采购5台服务器,每项业务分配一台服务器。但李工提出了一种基于虚拟化技术的解决方案,采用的服务器数量少于5台。

    在数据中心中应用虚拟化技术会带来哪些收益?请至少给出3项。


    正确答案:将虚拟化技术应用于企业数据中心将有效提高服务器的资源利用率支持运行在不同操作系统之上的多个业务共享同一台服务器从而减少企业数据中心中的服务器数量最终降低企业数据中心建设的硬件成本节约场地面积减少能耗。
    将虚拟化技术应用于企业数据中心将有效提高服务器的资源利用率,支持运行在不同操作系统之上的多个业务共享同一台服务器,从而减少企业数据中心中的服务器数量,最终降低企业数据中心建设的硬件成本,节约场地面积,减少能耗。 解析:在计算机领域,虚拟化通常是指计算元件在虚拟的(而不是真实的)基础上运行。虚拟化技术可以扩大硬件的容量,简化软件的重新配置过程。CPU的虚拟化技术可用单 CPU模拟多CPU的并行处理过程,允许一个平台同时运行多个操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。
    虚拟化技术与多任务以及超线程技术完全不同。多任务是指在一个操作系统中多个程序同时并行运行,在虚拟化技术中可以同时运行多个操作系统,并且每一个操作系统中都有多个程序在运行,每一个操作系统都运行在一个虚拟的CPU或者是虚拟主机上;而超线程技术只是单CPU模拟双CPU来平衡程序的运行性能,这两个模拟出来的CPU不能分离,只能协同工作。
    虚拟化技术可以有不同的实现方法,例如完全虚拟化、准虚拟化、操作系统层虚拟化等。
    最流行的虚拟化方法使用名为Hypervisor(虚拟机管理程序)的一种软件,在虚拟服务器和底层硬件之间建立一个抽象层。在完全虚拟化的环境下,Hypervisor运行在裸硬件上,充当主机操作系统;而由Hypervisor管理的虚拟服务器运行客户端操作系统(Guest OS)。Hypervisor可以捕获CPU指令,为指令访问硬件控制器和外设充当中介。因此,完全虚拟化技术几乎能让任何一款操作系统不用改动就能安装到虚拟服务器上,其主要缺点是给处理器带来的较大开销。
    完全虚拟化是处理器密集型技术,因为它要求Hypervisor管理各个虚拟服务器,并让它们彼此独立。减轻这种负担的一种方法就是改动客户操作系统,让它以为自己运行在虚拟环境下,能够与Hypervisor协同工作,这种方法就叫准虚拟化(para-virtualization)。
    Xen是开源准虚拟化技术的一个例子。操作系统作为虚拟服务器在Xen Hypervisor上运行之前,它必须在核心层面进行某些改变。因此,Xen适用于BSD、Linux、Solaris及其他开源操作系统,而不适合对类似于Windows的专有操作系统进行虚拟化处理,因为它们无法改动。准虚拟化技术的优点是性能高。经过准虚拟化处理的服务器可与 Hypervisor协同工作,其响应能力几乎不逊于未经过虚拟化处理的服务器。
    实现虚拟化还有一个方法,就是在操作系统层面增添虚拟服务器功能。Solaris Container就是这样的一个例子,Virtuozzo/OpenVZ是面向Linux的软件方案。
    就操作系统层的虚拟化而言,没有独立的Hypervisor层。相反,主机操作系统本身就负责在多个虚拟服务器之间分配硬件资源,并且让这些服务器彼此独立。一个明显的区别是,如果使用操作系统层虚拟化,所有虚拟服务器必须运行同一操作系统(不过每个实例有各自的应用程序和用户账户)。
    虽然操作系统层虚拟化的灵活性比较差,但本机速度性能比较高。此外,由于架构在所有虚拟服务器上使用单一、标准的操作系统,管理起来比异构环境要容易。
    当前,虚拟化技术的优势已经得到了业界的普遍认可,虚拟化技术所具备的提高资源利用率和节能环保的特性也得到了越来越多高性能计算机用户的青睐,虚拟化技术的普及和推广成为信息化技术发展的必然趋势。据业内专家分析,三个方面的因素使虚拟化技术迅速走向成熟。首先,信息化产业的快速发展使得服务器硬件技术有了巨大进步;其次,高端服务器所承载的软件应用环境已经逐步发展成熟:第三,也是最重要的一点,由于服务器技术的快速发展以及信息化产业发展对于数据中心的规模要求越来越高,由此导致数据中心面临着越来越严重的发展瓶颈,而虚拟化由于具有提高资源利用率以及节能环保、可进行大规模数据整合等特点而成为信息化技术发展的又一项具有战略意义的新技术。

  • 第3题:

    阅读以下关于数据库分析与建模的叙述,在答题纸上回答问题 1至问题 3。

    【说明】

    某电子商务企业随着业务不断发展,销售订单不断增加,每月订单超过了 50 万笔,急需开发一套新的互联网电子订单系统。同时该电商希望建立相应的数据中心,能够对订单数据进行分析挖掘,以便更好地服务用户。王工负责订单系统的数据库设计与开发,初步设计的核心订单关系模式为:orders(order_no,customer_no ,order_date,product_no,price,. ....);

    考虑订单数据过多,单一表的设计会对系统性能产生较大影响,仅仅采用索引不足以解决性能问题。因此,需要将订单表拆分,按月存储。

    王工采用反规范化设计方法来解决,给出了相应的解决方案。李工负责数据中心的设计与开发。李工认为王工的解决方案存在问题,建议采用数据物理分区技术。在解决性能问题的同时,也为后续的数据迁移、数据挖掘和分析等工作提供支持。

    【问题 1】 (8 分)

    常见的反规范化设计包括增加冗余列、增加派生列、重新组表和表分割。为解决题干所述需求,王工采用的是哪种方法?请用 300 字以内的文字解释说明该方法,并指出其优缺点。

    【问题 2】 (8 分)

    物理数据分区技术一般分为水平分区和垂直分区,数据库中常见的是水平分区。水平分区分为范围分区、哈希分区、列表分区等。请阅读下表,在(1)~(8) 中填写不同分区方法在数据值、数据管理能力、实施难度与可维护性、数据分布等方面的特点。

    【问题 3】(9 分)

    根据需求,李工宜选择物理水平分区中的哪种分区方法?请用 300字以内的文字分别解释说明该方法的优缺点。


    答案:
    解析:
    【问题 1】 (8 分)

    答案:

    王工采用的是表分割方式中的水平分割(分割参数是:“月”)

    表分割包括水平分割与垂直分割两种形式:

    水平分割:按记录进行分割,不同的记录可以分开保存,每个子表的列数相同。分割的条件可能是某列或多列数据的值,如时间参数。

    垂直分割:按进行分割,即把一条记录分开多个地方保存,每个子表的行数相同。把主键和一些行放到一个表,然后把主键和另外的列放到另一个表中,通过主键进行关联。

    优点:水平分割后可以降低在查询时需要读取的数据和索引页数,同时也降低了索引的层数,提高查询速度。

    缺点:水平分割会给应用增加复杂度,在查询时需要多个表名,查询所有数据需要union操作。

    【问题 2】 (8 分)

    答案:(1)连续(2)离散(3)弱(4)强(5)好(6)好(7)不均匀(8)均匀

    【问题 3】(9 分)

    答案:

    李工宜选择范围分区方式。

    范围分区优点:

    1、分区表可以将表存储到多个表空间内,各个分区维护各自的本地索引,查询语句可以根据索引进行分区范围查找,提高了查询速度;

    2、可以对单个分区进行备份、归档或者清除过期的数据,利于维护;

    3、实现容易,而且可以方便的对表的分区进行添加、删除、拆分和合并操作。

    范围分区缺点:数据分布不均匀所以可以与哈希分区组合应用。

  • 第4题:

    试题四(共25分)

    阅读以下关于数据库架构设计的叙述,回答问题1至问题3。

    某软件公司欲开发一个社交网络系统,该系统能够接收多个不同种类客户端发送的信息,并将这些信息实时显示在每个客户端的页面上供客户阅读。该系统将为数以百万计的用户服务,因此,要求采用的数据库能够支持大量信息存储,能够满足并发读写要求,并要求随着数据规模的扩大,数据库系统要易于进行扩充。关于数据库架构的设计,王工和张工提出了两种模式:王工提出基于传统的关系型数据库模式,通过向上扩展( Scale-up)以满足数据库的可扩展性要求;李工提出利用新兴的NoSQL数据库模式,通过向外扩展( Scale-out)以满足数据库的可扩展性要求。项目组经过讨论,决定采用李工提出的设计方案。

    【问题1】(11分)

    请指出关系数据库模式和NoSQL模式在并发支持、存储与查询、扩展方式、索引方式和应用领域五个方面各自的特点,结果填入表4-1中(1)~(10);并针对应用需求,说明项目组选择李工提出的设计方案的原因。

    【问题2】(8分)

    与传统的关系型数据库相比,NoSQL数据库所支持的典型数据存储类型有哪些?

    【问题3】(6分)

    在实际应用中,NoSQL数据库存在的问题有哪些?


    正确答案:

    试题四分析
    传统关系型数据库在需要处理大规模并发数据访问的社交网络应用场景下,暴露出了很多问题,例如需要很高的实时插入性能;需要海量的数据存储能力同时还需要非常快的查询和检索速度;需要将数据存储无缝扩展到整个集群环境下,并且能够支持在线扩展等。NoSQL数据库模式打破了传统关系型数据库的范式约束、SQL查询语言和事务一致性,实现了以键值数据格式存储的Hash数据库。
    本问题主要考查应试者对于关系型数据库和NoSQL数据模式的掌握情况,特别是关系型数据库和NoSQL数据库模式的特点和实现方式。本题结合一个典型的实际项目案例,首先要求应试者分析关系型数据库和NoSQL模式之间的异同,然后针对系统需求分析采用NoSQL数据库模式的原因;针对NoSQL数据库模式的典型应用,列举出其能够支持的数据存储方式及其特点;最后分析在实际应用中还需要在哪些方面进行改进以提升其应用效果。
    【问题1】
    本问题要求考生针对关系数据库模式和NoSQL模式的特点进行分析。关系数据库利用加锁机制支持并发操作,执行效率较低,利用关系表的方式存储数据,通过SQL语言和数据库进行交互,主要通过提升硬件配置等向上扩展方式提升性能,B树和哈希是常用的索引结构,其能够广泛应用于多个领域;NoSQL作为新兴的数据库模式处理并发的效率较高,支持海量数据存储和查询,利用增加分布存储的数据库节点数目扩展性能,主要以键值方式存储数据,在对于大规模并发数据处理的分布式应用中有更好的表现。
    根据项目的实际应用需求,所以采用NoSQL模式更为合适。
    【问题2】
    本问题要求考生掌握NoSQL数据模式所支持的数据类型。常见的数据类型包括表格/列存储、文档存储、图像存储、键值存储、对象和多值存储等。
    【问题3】
    本问题要求应试者分析NoSQL数据库模式在实际应用中的不足之处。作为一种新兴的数据库模式,其实现的完整性、应用范围和专业知识等与成熟的关系型数据库相比还有一定的差距。
    参考答案
    【问题1】
    关系数据库模式和NoSQL模式的特点比较:

    选择李工方案的原因分析:
    (1)社交网络系统对于数据库并发负载要求非常高,对于数量较大的数据库并发写要求,关系型数据库难以满足;
    (2)海量数据的高效率存储和访问需求,数百万账号信息,关系型数据库查询效率很低;
    (3)可扩展性需求,可以通过增加更多的服务器节点来实现扩展。
    【问题2】
    MySQL数据库支持的数据存储类型有:
    (1)表格/列存储:存储稀疏表格数据,类似于传统的二维表格式存储;
    (2)文档存储:用于存储非结构化或半结构化文件;
    (3)图像存储:利用节点、边和属性的方式存储图片类数据,常被用于存储社交网络服务中;
    (4)键值存储:类似哈希表一样存储简单的键值对,有基于内存和基于磁盘两种实现方式;
    (5)对象和多值存储:对象数据库存储面向对象语言中的对象,多值数据库存储表格型数据,每个单元格中可存储多个值。
    【问题3】
    NoSQL数据库存在的问题是:
    (1)成熟度不够,大量关键特性有待实现;
    (2)开源数据库产品的支持力度有限;
    (3)数据挖掘与商务智能支持不足,现有的产品无法直接使用NoSQL数据库;
    (4) NoSQL数据库专家较少,大部分都处于学习阶段。

  • 第5题:

    某大型企业在全国各城市共有40个左右的分支机构,这些机构已经建设了基于大型关系数据库的信息管理系统,每天负责独立地处理本区域内的业务并实时存储业务数据。?每个机构的数据库服务器从PC?Server(最小512MB内存)到RISC小型机(最大4GB内存)配置不一,操作系统也不一样,数据库产品类型也不统一。?每个机构平均每天产生约4MB的数据,数据表中包括TEXT字段;每季度一次性产生约100MB的统计和报表数据。?为了加强管理,实现对下属机构业务数据的异地存储备份,保证数据的安全及恢复,同时对全国业务数据进行挖掘分析,该企业拟在总部建设数据中心。数据中心通过公共广域网与各个分支机构组成VPN,每个分支机构到数据中心的逻辑信道带宽最高为128Kb/s。?【问题1】?(8分)(1)?为了保证数据上传的顺序、稳定、安全、并发、并解决数据库的异构问题,系统应采用下列哪种技术??A.交易中间件技术?B.Web中间件?C.Web?Service???D.插装技术?(2)?为保证分支机构可靠、高效地向数据中心汇总业务数据,避免单点故障,除了考虑广域网线路采用备份外,在数据中心还应采用什么技术?用100字以内文字说明。【问题2】?(8分)假设各个分支机构的历史数据已经通过某种方式顺利地存储到了数据中心。对于增量数据的汇总更新,总部的王副总工提议采用数据库复制技术和数据库的触发器技术获取数据更新日志的方式来完成,但张总认为这样做不仅增加了成本,而且不能解决全部问题。请用300字以内文字说明张总的理由。?【问题3】?(9分)最后,为解决数据中心数据更新与同步问题,张总安排总部的系统分析师李工来设计方案,并指出可以对王副总工的意见加以完善,如果需要也可以修改各地的业务系统。李工提出的方案具有较好的可执行性,并获得了大家的认可。请用400字以内文字叙述系统分析师李工的方案要点。


    答案:
    解析:
    【问题1】?(8分)(1)交易中间併技术。(2)数据中心数据库服务器采用多机集群Cluster和数据库并行处理技术,存储设备采用全冗余的SAN结构(或者全冗余的存储结构)。【问题2】?(8分)采用数据库复制技术,各地需要安装专门的复制服务器,增加成本,维护管理较为复杂,同时,太多分支机构使得中心的数据库复制服务器压力大,因此在本题要求的条件下,不宜采用数据库复制技术。?采用数据库触发器技术虽然能够实时记录数据库的数据变化,但不能捕获数据表中的TEXT字段的UPDATE动作,并且对于每季度一次的统计报表数据,采用数据库的触发器技术来记录数据库的变化,占用数据库资源太多,可能影响某些机构的日常业务处理。【问题3】?(9分)?(1)?针对多数业务数据的更新,各地数据库采用触发器技术,通过触发器捕获记录或文字的增删改操作,以标准的SQL命令保存到数据更新日志中;?(2)?改造各地原有业务系统,当发生数据表TEXT字段修改时,在修改字段的同一事务中,将该动作增加到数据更新日志中,数据中心根据记录抽取该字段指向的内容;?(3)?对每季度产生的报表统计数据,改造各地原有业务系统,在数据更新日志中保存生产数据的条件,数据中心根据记录一次性抽取满足条件的数据。?最后,针对个别机构数据库服务器配置较低,采用触发器技术可能造成资源不足的情况,升级该机构的数据库服务器,比如将内存增加到1GB等。