数据中心建设某大型企业在全国各城市共有40个左右的分支机构,这些机构已经建设了基于大型关系数据库的信息管理系统,每天负责独立地处理本区域内的业务,并实时存储业务数据。每个机构的数据库服务器从PCServer(最小512MB内存)到RISC小型机(最大4GB内存)配置不一,操作系统也不一样,数据库产品类型也不统一。每个机构平均每天产生约4MB的数据,数据表中包括TEXT字段;每季度一次性产生约100MB的统计和报表数据。为了加强管理,实现对下属机构业务数据的异地存储备份,保证数据的安全及恢复,同时对全国业务

题目

数据中心建设

某大型企业在全国各城市共有40个左右的分支机构,这些机构已经建设了基于大型关系数据库的信息管理系统,每天负责独立地处理本区域内的业务,并实时存储业务数据。

每个机构的数据库服务器从PCServer(最小512MB内存)到RISC小型机(最大4GB内存)配置不一,操作系统也不一样,数据库产品类型也不统一。

每个机构平均每天产生约4MB的数据,数据表中包括TEXT字段;每季度一次性产生约100MB的统计和报表数据。

为了加强管理,实现对下属机构业务数据的异地存储备份,保证数据的安全及恢复,同时对全国业务数据进行挖掘分析,该企业拟在总部建设数据中心。数据中心通过公共广域网与各个分支机构组成VPN,每个分支机构到数据中心的逻辑信道带宽为128kbps。

最后,为解决数据中心数据更新与同步问题,张总安排总部的系统分析师李工来设计方案,并指出可以对王副总工的意见加以完善,如果需要也可以修改各地的业务系统。李工提出的方案具有较好的可执行性,并获得了大家的认可。请用400字以内文字叙述系统分析师李工的方案要点。


相似考题

4.试题五(共 25 分)阅读以下关于Web 应用系统负载均衡的问题,在答题纸上回答问题1至问题3。某电子商务公司的主要业务是书籍、服装、家电和日用品的在线销售。随着公司业务发展和用户规模的不断扩大,现有的网上交易系统无法正常处理日益增大的请求流量,公司决策层决定升级其网上交易系统。在对该系统的升级方案进行设计和讨论时,公司的系统分析师王工提出采用基于高性能主机系统的方法进行系统升级,另外一位系统分析师李工则提出采用基于负载均衡集群的方法进行系统升级。公司的分析师和架构师对这两种思路进行讨论与评估,最终采纳了李工的方法。【问题 1】(9 分)请从系统的可用性、可伸缩性和应用特点三个方面说明公司为何没有采用王工提出的方法。【问题 2】(8 分)负载均衡通常分为传输层负载均衡和应用层负载均衡两类。请基于这种分类方式,说明基于 DNS 的负载均衡方法和基于 HTTP 重定向服务器的负载均衡方法分别属于哪类负载均衡方法,并用200字以内的文字说明这两种方法实现负载均衡的方式。【问题 3】(8 分)在确定使用基于负载均衡集群的系统升级方法后,李工给出了一个基于LVS(Linux Virtual Server)的负载均衡集群实现方案。公司的系统分析师在对现有系统进行深入分析的基础上,认为以下两个实际情况对升级方案影响较大,需要对该方案进行改进。1. 系统需要为在线购物提供购物车功能,用来临时存放选中的产品。2. 系统需要保证向所有的VIP 用户提供高质量的服务。针对上述描述,首先说明每种情况分别会引入哪些与负载均衡相关的问题,并用 200字以内的文字说明针对不同的问题,应该如何改进李工的解决方案。

更多“最后,为解决数据中心数据更新与同步问题,张总安排总部的系统分析师李工来设计方案,并指出可以对王副总工的意见加以完善,如果需要也可以修改各地的业务系统。李工提出的方案具有较好的可执行性,并获得了大家的认可。请用400字以内文字叙述系统分析师李工的方案要点。 ”相关问题
  • 第1题:

    阅读下列技术说明,根据要求回答问题1~问题4。

    [说明]

    某企业计划建设一个企业数据中心,该数据中心支持A、B、C、D、E 5项业务,各业务完全独立运行,各项业务运行的操作系统均不相同。在单台某型服务器上,除了为系统开销预留30%的CPU占用率之外,各业务在繁忙时段(白天)及非繁忙时段(夜间)的CPU占用率如表3-14所示。

    现该企业准备全部采用该类型服务器,张工和李工据此提出了不同的设计方案。张工认为需要采购5台服务器,每项业务分配一台服务器。但李工捉出了一种基于虚拟化技术的解决方案,采用的服务器数量少于5台。

    在数据中心中应用虚拟化技术会带来哪些收益?请用300字以内的文字简要描述,至少给出3项。


    正确答案:能有效提高服务器的资源利用率支持运行在不同操作系统之上的多个业务共享同一台服务器从而减少企业数据中心中的服务器数量最终降低企业数据中心建设的硬件成本节约场地面积节能环保
    能有效提高服务器的资源利用率,支持运行在不同操作系统之上的多个业务共享同一台服务器,从而减少企业数据中心中的服务器数量,最终降低企业数据中心建设的硬件成本,节约场地面积,节能环保 解析:在计算机领域,虚拟化通常是指计算元件在虚拟的(而不是真实的)基础上运行。虚拟化技术可以扩大硬件的容量,简化软件的重新配置过程。CPU的虚拟化技术可用单CPU模拟多CPU的并行处理过程,允许一个平台同时运行多个操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。
    虚拟化技术与多任务及超线程技术完全不同。多任务是指在一个操作系统中多个程序同时并行运行,在虚拟化技术中可以同时运行多个操作系统,并且每一个操作系统中都有多个程序在运行,每一个操作系统都运行在一个虚拟的CPU或者是虚拟主机上;而超线程技术只是单CPU模拟双CPU来平衡程序的运行性能,这两个模拟出来的CPU不能分离,只能协同工作。
    虚拟化技术可以有不同的实现方法,例如完全虚拟化、准虚拟化、操作系统层虚拟化等。
    目前,流行的虚拟化方法是使用名为Hypervisor(虚拟机管理程序)的一种软件,在虚拟服务器和底层硬件之间建立一个抽象层。在完全虚拟化的环境下,Hypervisor运行在裸硬件上,充当主机操作系统;而由Hypervisor管理的虚拟服务器运行客户端操作系统(Guest OS)。Hypervisor可以捕获CPU指令,为指令访问硬件控制器和外设充当中介。因此,完全虚拟化技术几乎能让任何一款操作系统不用改动就能安装到虚拟服务器上,其主要缺点是给处理器带来了较大开销。
    完全虚拟化是处理器密集型技术,因为它要求Hypervisor管理各个虚拟服务器,并让它们彼此独立。减轻这种负担的一种方法就是改动客户操作系统,让它以为自己运行在虚拟环境下,能够与Hypervisor协同工作,这种方法就叫准虚拟化(para-virtualization)。
    Xen是开源准虚拟化技术的一个例子。操作系统作为虚拟服务器在XenHypervisor上运行之前,它必须在核心层面进行某些改变。因此Xen适用于BSD、Linux、Solaris及其他开源操作系统,而不适合对类似于Windows专有操作系统进行虚拟化处理。准虚拟化技术的优点是性能高。经过准虚拟化处理的服务器可与Hypervisor协同工作,其响应能力几乎不逊于未经过虚拟化处理的服务器。
    实现虚拟化还有一个方法,就是在操作系统层面增添虚拟服务器功能。Solaris Container就是这样的一个例子,Virtuozzo/OpenVZ是面向Linux的软件方案。就操作系统层的虚拟化而言,没有独立的Hypervisor层。相反,主机操作系统本身就负责在多个虚拟服务器之间分配硬件资源,并且让这些服务器彼此独立。一个明显区别是,如果使用操作系统层虚拟化,则所有虚拟服务器必须运行同一操作系统(不过每个实例有各自的应用程序和用户账户)。虽然操作系统层虚拟化的灵活性比较差,但本机速度性能比较高。此外,由于架构在所有虚拟服务器上使用单一、标准的操作系统,管理起来比异构环境要容易。
    当前,虚拟化技术的优势已经得到了业界的普遍认可,虚拟化技术所具备的提高资源利用率和节能环保的特性也得到了越来越多的高性能计算机用户的青睐,虚拟化技术的普及和推广成为信息化技术发展的必然趋势。据业内专家分析,有3个方面的因素使虚拟化技术迅速走向成熟。首先,信息化产业的快速发展使得服务器硬件技术有了巨大进步;其次,高端服务器所承载的软件应用环境已经逐步发展成熟;最后,也是最重要的一点,由于服务器技术的快速发展及信息化产业发展对于数据中心的规模要求越来越高,由此导致数据中心面临着越来越严重的发展瓶颈,而虚拟化由于具有提高资源利用率,以及节能环保、可进行大规模数据整合等特点而成为信息化技术发展的又一项具有战略意义的新技术。

  • 第2题:

    某大型企业在全国各城市共有40个左右的分支机构,这些机构已经建设了基于大型关系数据库的信息管理系统,每天负责独立地处理本区域内的业务并实时存储业务数据。?每个机构的数据库服务器从PC?Server(最小512MB内存)到RISC小型机(最大4GB内存)配置不一,操作系统也不一样,数据库产品类型也不统一。?每个机构平均每天产生约4MB的数据,数据表中包括TEXT字段;每季度一次性产生约100MB的统计和报表数据。?为了加强管理,实现对下属机构业务数据的异地存储备份,保证数据的安全及恢复,同时对全国业务数据进行挖掘分析,该企业拟在总部建设数据中心。数据中心通过公共广域网与各个分支机构组成VPN,每个分支机构到数据中心的逻辑信道带宽最高为128Kb/s。?【问题1】?(8分)(1)?为了保证数据上传的顺序、稳定、安全、并发、并解决数据库的异构问题,系统应采用下列哪种技术??A.交易中间件技术?B.Web中间件?C.Web?Service???D.插装技术?(2)?为保证分支机构可靠、高效地向数据中心汇总业务数据,避免单点故障,除了考虑广域网线路采用备份外,在数据中心还应采用什么技术?用100字以内文字说明。【问题2】?(8分)假设各个分支机构的历史数据已经通过某种方式顺利地存储到了数据中心。对于增量数据的汇总更新,总部的王副总工提议采用数据库复制技术和数据库的触发器技术获取数据更新日志的方式来完成,但张总认为这样做不仅增加了成本,而且不能解决全部问题。请用300字以内文字说明张总的理由。?【问题3】?(9分)最后,为解决数据中心数据更新与同步问题,张总安排总部的系统分析师李工来设计方案,并指出可以对王副总工的意见加以完善,如果需要也可以修改各地的业务系统。李工提出的方案具有较好的可执行性,并获得了大家的认可。请用400字以内文字叙述系统分析师李工的方案要点。


    答案:
    解析:
    【问题1】?(8分)(1)交易中间併技术。(2)数据中心数据库服务器采用多机集群Cluster和数据库并行处理技术,存储设备采用全冗余的SAN结构(或者全冗余的存储结构)。【问题2】?(8分)采用数据库复制技术,各地需要安装专门的复制服务器,增加成本,维护管理较为复杂,同时,太多分支机构使得中心的数据库复制服务器压力大,因此在本题要求的条件下,不宜采用数据库复制技术。?采用数据库触发器技术虽然能够实时记录数据库的数据变化,但不能捕获数据表中的TEXT字段的UPDATE动作,并且对于每季度一次的统计报表数据,采用数据库的触发器技术来记录数据库的变化,占用数据库资源太多,可能影响某些机构的日常业务处理。【问题3】?(9分)?(1)?针对多数业务数据的更新,各地数据库采用触发器技术,通过触发器捕获记录或文字的增删改操作,以标准的SQL命令保存到数据更新日志中;?(2)?改造各地原有业务系统,当发生数据表TEXT字段修改时,在修改字段的同一事务中,将该动作增加到数据更新日志中,数据中心根据记录抽取该字段指向的内容;?(3)?对每季度产生的报表统计数据,改造各地原有业务系统,在数据更新日志中保存生产数据的条件,数据中心根据记录一次性抽取满足条件的数据。?最后,针对个别机构数据库服务器配置较低,采用触发器技术可能造成资源不足的情况,升级该机构的数据库服务器,比如将内存增加到1GB等。

  • 第3题:

    阅读以下关于Web 应用系统负载均衡的问题,在答题纸上回答问题1至问题3。
    某电子商务公司的主要业务是书籍、服装、家电和日用品的在线销售。随着公司业务发展和用户规模的不断扩大,现有的网上交易系统无法正常处理日益增大的请求流量,公司决策层决定升级其网上交易系统。在对该系统的升级方案进行设计和讨论时,公司的系统分析师王工提出采用基于高性能主机系统的方法进行系统升级,另外一位系统分析师李工则提出采用基于负载均衡集群的方法进行系统升级。公司的分析师和架构师对这两种思路进行讨论与评估,最终采纳了李工的方法。 【问题 1】(9 分)
    请从系统的可用性、可伸缩性和应用特点三个方面说明公司为何没有采用王工提出的方法。
    【问题 2】(8 分)
    负载均衡通常分为传输层负载均衡和应用层负载均衡两类。请基于这种分类方式,说明基于 DNS 的负载均衡方法和基于 HTTP 重定向服务器的负载均衡方法分别属于哪类负载均衡方法,并用200字以内的文字说明这两种方法实现负载均衡的方式。
    【问题 3】(8 分)
    在确定使用基于负载均衡集群的系统升级方法后,李工给出了一个基于LVS(Linux Virtual Server)的负载均衡集群实现方案。公司的系统分析师在对现有系统进行深入分析的基础上,认为以下两个实际情况对升级方案影响较大,需要对该方案进行改进。
    1. 系统需要为在线购物提供购物车功能,用来临时存放选中的产品。
    2. 系统需要保证向所有的VIP 用户提供高质量的服务。
    针对上述描述,首先说明每种情况分别会引入哪些与负载均衡相关的问题,并用 200字以内的文字说明针对不同的问题,应该如何改进李工的解决方案。


    答案:
    解析:
    试题分析本题考查的是Web应用系统设计、维护和升级的相关内容,主要考查系统负载均衡技术。
    【问题1】
    本问题考查Web应用系统升级时的方案选择问题。在Web应用中,服务器的处理能力和IO已经成为提供应用服务的瓶颈。由于涉及的信息量非常大,用户访问频率也高,许多基于Web的大型应用系统每秒钟需要处理下百万个甚至更多的请求。显然单台服务器有限的性能难以解决这个问题。
    为了解决下述问题,采用高性能的主机系统(小型机或大型机)是可行的。但是,除了其价格昂贵、可扩展性差以外,这种主机系统在很多情况下也不能同时处理上百万个并发的请求。因为高速主机系统只是对于复杂单一任务和有限的并发处理显得高性能,而Internet中的Web应用绝大多数处理是简单任务、高强度并发处理。因此,即便有大量资金投入,采用高性能、高价格的主机系统,也不能满足Web应用的需要。
    【问题2】
    本问题主要考查负载均衡技术的分类和两种具体方法的掌握。负载均衡技术是集群系统中一项重要技术,可以提高集群系统的整体处理能力,也提高了系统的可靠性,最终目标是加快集群系统的响应速度,提高客户端访问的成功概率。
    负载均衡通常分为传输层负载均衡和应用层负载均衡两类。基于DNS的负载均衡属于传输层负载均衡技术,其主要原理是在DNS服务器中为同一个主机名配置多个地址,在应答DNS查询时,DNS服务器对每个查询将以DNS文件中主机记录的IP地址按顺序返回不同的解析结果,将客户端的访问引导到不同的节点上去,使得不同的客户端访问不同的节点,从而达到负载均衡的目的。基于HTTP重定向服务器的负载均衡属于应用层负载均衡技术,其主要原理是服务器使用HTTP重定向指令,将一个客户端重新路山到另一个位置。服务器返回一个重定向响应,而不是返回请求的对象。客户端确认新地址然后重发请求,从而达到负载均衡的目的。
    【问题3】
    主要考查负载均衡技术的实际应用。在实际应用中,通常会将传输层负载均衡方法与应用层负载均衡方法结合起来使用,以提高系统整体的性能、可用性和可靠性。
    题干描述中,第一种情况的描述说明系统需要提供应用会话数据支持。通常采用会话服务器(session server)机制在服务器端存放应用会话数据。但需要注意的是,应用会话数据大多数情况下是不可恢复的,因此采用支持应用会话数据容错的解决方案非常重要。
    第二种情况的描述要求保证特定用户的服务质量。当数据量不断增长时,由于在会话服务器或缓存服务器,业务服务器和会话(或缓存)服务器之间可能会反复移动较大量的数据,从而无法保证服务质量。因此,通常的做法是基于应用层负载均衡器实现客户端联系(client affinity)将某个客户端的所有请求转发到相同的服务器上,使得一个用户会话的所有请求被同一服务器实例处理,从而保证服务质量。试题答案(5)【问题1】
    王工提出的方案是采用高性能的主机系统实现系统升级。从可用性角度看,采用高性能的主机系统很难实现系统的冗余机制,当发生故障后会导致整个系统会失去响应能力,从而无法保证系统的高可用性;从可伸缩性角度看,采用高性能的主机系统,升级服务器的成本与获得的相应能力不成比例,整个系统的可扩展性较差;从应用特点来看,Internet中的Web应用绝大多数是简单任务、高强度的并发处理,而主机系统只是对于复杂单一任务和有限的并发处理具有高性能,不能同时处理大量的并发请求。因此,公司没有采用王工的方案。
    【问题2】
    基于DNS的负载均衡属于传输层负载均衡技术,其主要原理是在DNS服务器中为同一个主机名配置多个地址,在应答DNS查询时,DNS服务器对每个查询将以DNS文件中主机记录的IP地址按顺序返回不同的解析结果,将客户端的访问引导到不同的节点上去,使得不同的客户端访问不同的节点,从而达到负载均衡的目的。
    基于HTTP重定向服务器的负载均衡属于应用层负载均衡技术,其主要原理是服务器使用HTTP重定向指令,将一个客户端重新路由到另一个位置。服务器返回一个重定向响应,而不是返回请求的对象。客户端确认新地址然后贡发请求,从而达到负载均衡的目的。
    【问题3】
    第一种情况的描述说明系统需要提供应用会话数据支持。通常采用会话服务器机制在服务器端存放应用会话数据。但需要注意的是,应用会话数据大多数情况下是不可恢复的,因此采用支持应用会话数据容错的解决方案非常重要。
    第二种情况的描述要求保证特定用户的服务质量。当数据量不断增长时,由于在会话服务器或缓存服务器,业务服务器和会话(或缓存)服务器之间可能会反复移动较大量的数据,从而无法保证服务质量。因此,通常的做法是基于应用层负载均衡器实现客户端联系,将某个客户端的所有请求转发到相同的服务器,使得一个用户会话的所有请求被同一服务器实例处理,从而保证服务质量。

  • 第4题:

    根据李工提供的上述统计数据和分析意见,企业主管认为李工不是一个称职的测试组织者,并提出了至少有4个方面的理由说明必须加强测试力量并完善测试工作,请你用300字以内文字简要说明李工的结论中存在的问题。


    正确答案:(1)除了模块部件级测试外还需要进行集成测试和系统测试。 (2)改正共同发现的错误虽然可以减少错误但未改正的错误和潜在的错误仍然很多本例中4天共约22+16+16+14=68个错误没有改正约占到已被测试模块估计错误总数的41%并且这些错误需要重新测试确认。那些未能发现的错误更难被测试到这些错误需要花费更多的人力或时间才能改正。错误数不可能线性减少。 (3)改正错误时还会引发新的错误。统计发现某些局部性错误的改正往往在集成测试或系统测试时暴露出新的问题。 (4)上述定量方法过于粗糙确定的时间进度可信度差。
    (1)除了模块部件级测试外,还需要进行集成测试和系统测试。 (2)改正共同发现的错误虽然可以减少错误,但未改正的错误和潜在的错误仍然很多,本例中4天共约22+16+16+14=68个错误没有改正,约占到已被测试模块估计错误总数的41%,并且这些错误需要重新测试确认。那些未能发现的错误更难被测试到,这些错误需要花费更多的人力或时间才能改正。错误数不可能线性减少。 (3)改正错误时还会引发新的错误。统计发现,某些局部性错误的改正往往在集成测试或系统测试时暴露出新的问题。 (4)上述定量方法过于粗糙,确定的时间进度可信度差。 解析:分析李工的测试结论存在的问题。

  • 第5题:

    阅读以下关于 Web 系统架构设计的叙述,在答题纸上回答问题1 至问题 3。

    【说明】

    某公司开发的 B2C 商务平台因业务扩展,导致系统访问量不断增大,现有系统访问速度缓慢,有时甚至出现系统故障瘫痪等现象。面对这一情况,公司召开项目组讨论会议,寻求该商务平台的改进方案。讨论会上,王工提出可以利用镜像站点、CDN 内容分发等方式解决并发访问量带来的问题。而李工认为,仅仅依靠上述外网加速技术不能完全解决系统现有问题,如果访问量持续增加,系统仍存在崩渍的可能。李工提出应同时结合 Web 内网加速技术优化系统改进方案,如综合应用负载均衡、缓存服务器、Web 应用服务器、分布式文件系统、分布式数据库等。经过讨论,公司最终决定采用李工的思路,完成改进系统的设计方案。

    【问题 1】 (10 分)

    针对李工提出的改进方案,从 a ~j 中分别选出各技术的相关描

    述和对应常见支持软件填入表 5-1 中的(1) ~(10) 处。

    【问题 2】(9 分)

    请用 100 字以内的文字解释分布式数据库的概念,并给出提高分布式数据库系统性能的 3 种常见实现技术。

    【问题 3】 (6 分)

    针对 B2C 商务购物平台的数据浏览操作远远高于数据更新操作的特点,指出该系统应采用的分布式数据库实现方式,并分析原因。


    答案:
    解析:
    【问题 1】 (10 分)
    答案:(1)b;(2)e;(3)a;(4)i;(5)c;(6)d;(7)g;(8)f;(9)h;(10)j。
    【问题 2】(9 分)

    答案:分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个节点具有独立处理的能力(称为场地自治),它可以执行局部应用,同时,每个节点也能通过网络通信子系统执行全局应用。

    (1)采用数据分片技术,提高访问的局部性,提升系统性能。

    (2)采用查询优化技术(包括:全局查询树的变换、副本的选择与多副本的更新策略、查询树的分解、半连接与直接连接)提高查询速度。

    (3)读写分离技术

    【问题 3】 (6 分)

    答案:在本题所涉及到的环境中,由于读取数据的需求非常强烈,涉及到的数据量极大,而更新较少,可以在分布式数据库中采用一主多从的机制来分散读取数据的压力。更新数据时,操作主库,从主库再同步到从库,从库只负责读取数据。