论数据库集群技术及应用随着经济的高速发展,企业的用户数量、数据量呈爆炸式增长,对数据库管理提出了严峻的考验。数据库系统是大多数商业信息系统的核心,因此除了业务逻辑之外,企业对数据库系统的系统性能、数据可靠性和服务可用性都提出了较高要求。为满足企业用户的实际需求,近年来数据库集群技术出现了飞速发展。按照数据库集群的架构可分为共享磁盘型和非共享磁盘型数据库集群。不同的数据库集群产品采用了不同的数据同步机制,各具特色,可满足不同类型的应用需求。业务在实现信息系统时,需要根据数据管理的实际需求,选择合适的数据库集

题目

论数据库集群技术及应用

随着经济的高速发展,企业的用户数量、数据量呈爆炸式增长,对数据库管理提出了严峻的考验。数据库系统是大多数商业信息系统的核心,因此除了业务逻辑之外,企业对数据库系统的系统性能、数据可靠性和服务可用性都提出了较高要求。为满足企业用户的实际需求,近年来数据库集群技术出现了飞速发展。

按照数据库集群的架构可分为共享磁盘型和非共享磁盘型数据库集群。不同的数据库集群产品采用了不同的数据同步机制,各具特色,可满足不同类型的应用需求。业务在实现信息系统时,需要根据数据管理的实际需求,选择合适的数据库集群产品。

请以“数据库集群技术及应用”为题,分别从以下三个方面进行论述。 1. 概要叙述你参与实施的软件项目以及你在其中所担任的主要工作。 2. 请说明你所参与的软件项目对数据管理的实际需求,结合数据库集群技术的特点,论述你是如何应用数据库集群技术或设计数据库集群系统的。 3. 请简要说明数据库集群产品的应用效果及存在的问题。


相似考题
参考答案和解析
正确答案:

一、论文中要说明所参与管理和开发的软件项目,并明确指出在其中承担的主要任务和开展的主要工作。

二、需要结合项目实际情况来说明如何应用数据库集群技术,在此值得注意的是,数据库集群技术与传统数据库最大区别在于传统数据库利用的是高性能服务器,而集群技术是用一系列的PC机组成集群,提供数据库服务。所以传统数据库一旦升级,需要支出高额的成本(换掉原来的服务器),而如果采用集群方式就只需要增加集群中的机器,所以从可扩展性,性能,可用性等一系列方面都有明显优势。在论述为何选用数据库集群技术时,可谈到此方面的话题。

所谓如何应用集群技术与设计数据库集群系统,主要是从性能与可用性方面采取一些策略来进行设计。

1. 提高处理速度的四种办法  

(1)提高磁盘速度 

主要思想是提高磁盘的并发度。尽管实现方法各不相同,但是它们最后的目的都是提供一个逻辑数据库的存储映象。系统为了提高磁盘访问速度,建立一个虚拟的涵盖所有数据“大”数据库,而不用去考虑数据的实际物理磁盘存放位置。  

(2)分散数据的存放 

利用多个物理服务器来存放数据集的不同部分,使得不同的服务器进行并行计算成为可能。ORACLE RAC是共享磁盘的体系结构,用户只需简单地增加一个服务器节点,RAC就能自动地将这节点加入到它的集群服务中去,RAC会自动地将数据分配到这节点上,并且会将接下来的数据库访问自动分布到合适的物理服务器上,而不用修改应用程序;UDB是非共享磁盘的体系结构,需要手工修改数据分区,MSCS和ASE也是同样情况。ICX是一种基于中间件的数据库集群技术,对客户端和数据库服务器都是透明的。可以用来集群几个数据库集群。 系统通过化整为零的策略,将数据表格分散到多个服务器或者每个服务器分管几个内容不同的表格,这样做的目的在于通过多服务器间并行运算以提高访问速度。  

(3)对称多处理器系统  

  利用多处理机硬件技术来提高数据库的处理速度。 所有基于数据库引擎的集群都支持这个技术。 将多CPU处理器进行合理调度,来同时处理不同的访问要求,但这种技术在数据库上的应用的实际收益是很有限的。  

(4)交易处理负载均衡

在保持数据集内容同步的前提下,将只读操作分布到多个独立的服务器上运行。因为绝大多数的数据库操作是浏览和查询,如果我们能拥有多个内容同步的数据库服务器,交易负载均衡就具有最大的潜力(可以远远大于上面叙述的最多达四个处理器的对称多处理器系统)来提高数据库的处理速度,同时会具有非常高的数据可用性。 所有基于数据库引擎的集群系统都只支持一个逻辑数据库映象和一个逻辑或物理的备份。这个备份的主要目的是预防数据灾难。因此,备份里的数据只能通过复制机制来更新,应用程序是不能直接更新它的。利用备份数据进行交易负载均衡只适用于一些非常有限的应用,例如报表统计、数据挖掘以及其它非关键业务的应用。 负载平衡算是一项“老”技术了。但将性能提高到最大也是集群设计所追求的终极目标。

2. 提高可用性的四种方法  

(1)硬件级冗余 

让多处理机同时执行同样的任务用以屏蔽瞬时和永久的硬件错误。有两种实现方法:构造特殊的冗余处理机和使用多个独立的数据库服务器。 基于数据库的集群系统都是用多个独立的数据库服务器来实现一个逻辑数据库,在任意瞬间,每台处理器运行的都是不同的任务。这种系统可以屏蔽单个或多个服务器的损坏,但是因为没有处理的冗余度,每次恢复的时间比较长。 传统意义上,硬件越贵,性能越高,但往往事与愿违。想通过追加和升级硬件设备来改善硬件级的冗余,要进行详细的需求分析和论证。  

(2)通讯链路级冗余

冗余的通讯链路可以屏蔽瞬时和永久的通讯链路级的错误。 基于数据库引擎的集群系统有两种结构:共享磁盘和独立磁盘。RAC, MSCS 可以认为是共享磁盘的集群系统,UDB和ASE 是独立磁盘的集群系统。共享磁盘集群系统的通讯的冗余度最小,通讯链路级的冗余具有容错功能。  

(3)软件级冗余 

由于现代操作系统和数据库引擎的高度并发性,由竞争条件、死锁、以及时间相关引发的错误占据了非正常停机服务的绝大多数原因。采用多个冗余的运行数据库进程能屏蔽瞬时和永久的软件错误。基于数据库引擎的集群系统都用多个处理器来实现一个逻辑数据库,它们只能提供部分软件冗余,因为每一瞬间每个处理器执行的都是不同的任务。 改善软件设计来提高冗余性能和屏蔽软件级错误是每个技术开发商的梦想。传统的集群系统只能提供部分软件冗余。

(4)数据冗余 

被动更新数据集:所有目前的数据复制技术(同步或异步),例如磁盘镜像、数据库文件复制以及数据库厂商自带的数据库备份工具都只能产生被动复制数据集。它一般只用于灾难恢复。 多数应用都是采用被动更新数据集的方法。这种方法容灾能力差,资源占用多,已面临淘汰和革新。  

主动更新数据集:这种数据集需要一台或多台备份数据库服务器来管理,它可用于报表生成,数据挖掘,灾难恢复甚至低质量负载均衡。分同步和异步两种。  

①异步主动复制数据集:先把事务处理交给主服务器来完成,然后事务处理再被串行地交给备份服务器以执行同样操作来保证数据一致性。所有的商用数据库都支持异步主动复制技术。  

②同步主动复制数据集:要求所有并发事务处理在所有数据库服务器上同时完成。直接好处就是解决了队列管理问题,同时通过负载均衡实现更高性能和可用性。RAC, UDB, MSCS 和 ASE是用完全串行化并结合两阶段提交协议来实现的,设计目标就是为了获得一份可用于快速灾难恢复的数据集。 主动更新数据集是目前比较先进的数据冗余方法。专业人员还可以进行更底层的技术细节比较。底层技术的差异直接影响着一些重要指标。 提高安全和数据集可扩性的技术 在提高数据库安全性和数据集可扩性这两方面,可以创新的空间是很小的。

三、存在的问题与解决方案则需要结合项目实践进行论述。


更多“论数据库集群技术及应用 随着经济的高速发展,企业的用户数量、数据量呈爆炸式增长,对数据库管理 ”相关问题
  • 第1题:

    当前数据库技术的发展已形成各种类型的数据库应用技术,下述为数据库应用技术的有( )。

    Ⅰ.应用的驱动

    Ⅱ.多种技术与数据库技术的结合

    Ⅲ.关系数据库的研究基础

    A.Ⅰ

    B.Ⅱ

    C.Ⅰ和Ⅱ

    D.Ⅰ、Ⅱ和Ⅲ


    正确答案:D

  • 第2题:

    数据库管理技术的发展经历了由低级到高级的过程。分布式数据库、面向对象数据库等新型数据库属于( )。

    A.人工管理阶段

    B.文件系统阶段

    C.数据库系统阶段

    D.高级数据库技术阶段


    正确答案:D
    解析:数据库管理技术经历了人工管理、文件系统、数据库系统、高级数据库技术4个阶段。分布式数据库、面向对象数据库是属于高级数据库技术阶段。

  • 第3题:

    当前数据库技术的发展已形成各种类型的数据库应用技术,下述属于这种发展推动力的是:

    Ⅰ.应用的驱动

    Ⅱ.多种技术与数据库技术的结合

    Ⅲ.关系数据库的研究基础

    A.Ⅰ

    B.Ⅱ

    C.Ⅰ和Ⅱ

    D.Ⅰ、Ⅱ和Ⅲ


    正确答案:D
    解析:数据库技术的发展是应用实际的需要,关系型数据库的广泛应用和发展,面向对象技术等与数据库技术的结合而迅速发展的。

  • 第4题:

    现有一个大型咨询公司的数据库应用系统,每个部门都要生成大量的全局报表并执行少量的更新操作。随着数据量的增加,系统出现了性能瓶颈。鉴于各个部门地理上是分散的,公司希望采用分布式数据库技术解决该问题。下列数据分配方式中最适合该应用的是( )。

    A.集中式

    B.分割式

    C.复制式

    D.混合式


    正确答案:C
    集中式是指所有的数据片断都安排在一个场地上。分割式是指所有全局数据只有一份,它们被分割成若干片断,每个片断被分配在一个特定的场地上。全复制式是指全局数据有多个副本,每个场地上都有一个完整的数据副本。混合式是指全局数据被分为若干个数据子集,每个子集都被安排在一个或多个场地上,但是每个场地未必保存所有数据。以上四种分配方式各有千秋,但复制式在每个分场都有完整的的数据,这样大大减少了各部门对全局数据的访问。因此采用复制式数据分配能够提高每个场地的响应速度。

  • 第5题:

    伴随着计算机技术的发展,数据处理的发展经历了(66)阶段。

    A.人工管理→文件管理→数据库管理→分布式数据库管理

    B.人工管理→文件管理→分布式数据库管理→数据库管理

    C.人工管理→数据库管理→文件管理→分布式数据库管理

    D.人工管理→数据库管理→分布式数据库管理→文件管理


    正确答案:A
    解析:数据处理和数据管理的发展过程大致经历了人工管理、文件管理、数据库管理及分布式数据库管理四个阶段。

  • 第6题:

    关于云存储管理叙述错误的是()

    A云计算环境下数据量急速膨胀,传统关系型数据库难以应对且成本较高。

    B通过分布式数据库和海量存储技术,能使普通服务器发挥更大作用。

    C。bigdAtA和OrAcle拥有分布式数据库核心技术。

    D云存储管理技术与数据库管理技术类似。


    参考答案:D

  • 第7题:

    请以“数据库集群技术及应用”为题,分别从以下三个方面进行论述。

    1. 概要叙迷你参与实施白勺落欠件项目以及你在其中所担任的主要工作。

    2. 请说明你所参与的软件项目对数据管理的契示需求,结合数据库集群技术的特点,论述你是如何应用数据库集群技术或设计数据库集群系统的。

    3. 简要说明数据库集群产品的应用效果及存在的问题。


    答案:
    解析:
    1. 概要叙迷你参与实施白勺落欠件项目以及你在其中所担任的主要工作。

    解析:

    根据要求能够概要叙述你参与项目的背景,可以包括项目的名称、起始时间、甲方业务场景介绍、建设内容、数据分析需求、采用的数据库集群技术等内容,介绍你在本项目中的角色,工作职责,主要承担的工作等内容。此部分内容可以分为一段,或者二段均可,字数在300-400为宜。

    2. 请说明你所参与的软件项目对数据管理的契示需求,结合数据库集群技术的特点,论述你是如何应用数据库集群技术或设计数据库集群系统的。

    解析:

    数据库集群系统是利用多台数据库服务器,构成一个虚拟单一的数据库逻辑映像,如同单数据库一样,向客户端提供透明的数据服务。

    为保证虚拟单一的数据库逻辑映像,数据库集群系统有多种实现方式:单份数据集,两份或多份相似但非实时同步的数据集,两份或多份实时一致的数据集等。

    数据库集群的特点包括:数据库集群系统往往是同构系统,集群中各个节点具有相同的操作系统和数据库系统版本;数据库集群往往建立在高速局域网内,一般通过多台服务器提供数据冗余,为客户端提高数据的高可用性和高可靠性;通过多种负载均衡技术为客户端提供高性能。

    按照数据库集群的架构可分为共享磁盘型和非共孪磁盘型数据库集群。共享磁盘型的数据库集群只有一个单一的数据集,不存在节点之间的数据同步问题。非共享磁盘型数据库集群系统包含多个物理机器,为保持统一的逻辑数据视图,数据同步是一个核心问题。数据库集群系统中常见的数据同步机制包括:

    串行数据复制分为串行异步复制和串行同步复制

    串行异步复制:主要采用数据库事务日志传送或者硬盘数据块传送技术来实现。主数据库完成事务处理后,生成事务日志或将数据写入数据块中,通过FIFO队列的形式,将数据传送到备份数据库,得到一致数据。存在的主要问题是:异步会存在时间差,带来主、备数据库的数据的不一致,也可能会丢失数据;同时存在一定的额外开销。

    串行同步复制:此类集群往往是由昂贵的专用软硬件构成,采用专用的高速网络和软件技术,将每个数据库的请求,通过同步复制的方式,同步在主备两台数据库服务器执行正确后,才将结果返回给数据库客户。其主要特点是主备服务器同时处理,性能低,而且专用系统造价昂贵。

    基于共享存储技术:典型的产品是数据库的双机容错技术,也包括Oracle的RAC 产品。该系统的架构是多个机器共享一个磁盘阵列,服务器通过虚拟IP提供服务,形成单一的逻辑数据库。一旦某个机器异常,则通过心跳检测或其他信息交换协议,完成主备机器的切换。主要特点是单一数据存储,存在数据同步问题,但是单一数据往往成为整个系统的单点错误源;而且只能通过数据库中常用的备份或复制方法获取第二份数据,以保证数据安全,因此,所有复制或备份方法的缺点,此类系统全部存在。另外,主备机器的切换也需要时间开销。

    基于实时数据同步技术:此类集群的基本特征是节点有自己独立的存储设备,数据采用非共享存储。因此该集群一般均提供负载均衡技术,采用的负载均衡技术有基于连接的负载均衡和基于请求的负载均衡两种。在实现节点之间的数据同步上,或者通过专门的卨速数据同步技术,或者通过分布式数据库中的两阶段提交协议来实现。此类集群系统的核心特点是:1)实时冗余一致的数据存储,理论上实现了数据的零丢失,可以做到很高的可用性;2)由于需要额外的数据同步操作,因此性能会受到一定的影响,如采用两阶段提交来实现同步,则慢一些;同时,额外的数据同步也限制了集群中的节点数目。

    问前基于共享存储和基于实时数据同步技术(即非共享存储)是数据库集群中的主流技术,串行数据M制也可以算作是非共享存储中的一种,但由于性能较差,缺陷明显,在市场上采用的较少。在实际选择数据库集群产品时,需要考虑的问题包括:数据的并发/性能需求、数据容量、数据可靠性、数据可用性、实现成本等问题。

    3.简要说明数据库集群产品的应用效果及存在的问题。

    解析:

    该部分应能够以该项目的具体示例为佐证,描述采取数据库集群技术后,在数据访问能力,执行效率,页面响应等多方面的效率,通过对比,体现数据集群技术的优势,对企业的帮助,同时,在应用中,必然会有一些问题,采用发现问题,分析问题,排除障碍,解决问题的思路、方法和工具,建立起适合企业的、稳定的数据库集群。

  • 第8题:

    数据库管理技术是在()的基础上发展起来的。

    • A、文件系统
    • B、编译系统
    • C、应用程序系统
    • D、数据库管理系统

    正确答案:A

  • 第9题:

    数据库管理技术的发展是与计算机技术及其应用的发展联系在一起的,它经历了三个阶段:人工管理阶段、()阶段和数据库系统阶段。


    正确答案:文件系统

  • 第10题:

    随着地理信息系统的开发与应用发展起来的是()。

    • A、分布式数据库
    • B、空间数据库
    • C、多媒体数据库
    • D、数据仓库

    正确答案:B

  • 第11题:

    单选题
    ERP是基于数据库技术的软件产品,它是指()。
    A

    企业数据库应用系统

    B

    数据库开发工具

    C

    数据库管理系统

    D

    分布式数据库系统


    正确答案: D
    解析: 暂无解析

  • 第12题:

    单选题
    随着地理信息系统的开发与应用发展起来的是()。
    A

    分布式数据库

    B

    空间数据库

    C

    多媒体数据库

    D

    数据仓库


    正确答案: D
    解析: 暂无解析

  • 第13题:

    数据管理技术的发展是与计算机技术及其应用的发展联系在一起的,经历了由低级到高级的发展过程。分布式数据库、面向对象数据库等新型数据库是属于哪个阶段?

    A.人工管理阶段

    B.文件系统阶段

    C.数据库系统阶段

    D.高级数据库技术阶段


    正确答案:D

  • 第14题:

    数据库管理技术的发展是与计算机技术及其应用的发展联系在一起的,经历了由低级到高级的发展过程。分布式数据库、面向对象数据库等新型数据库是属于______发展阶段的。

    A.人工管理阶段

    B.文件系统阶段

    C.数据库系统阶段

    D.高级数据库技术阶段


    正确答案:D
    解析:数据库管理技术经历了人工管理、文件系统、数据库系统及高级数据库技术阶段。分布式数据库、面向对象数据库等新型数据库是属于高级数据库技术阶段。

  • 第15题:

    数据管理技术的发展是与计算机技术及其应用的发展联系在一起的,经历了由低级到高级的发展。分布式数据库、面向对象数据库等新型数据库属于哪一个发展阶段?

    A.人工管理阶段

    B.文件系统阶段

    C.数据库系统阶段

    D.高级数据库技术阶段


    正确答案:D
    解析:高级数据库技术阶段大约从20世纪70年代后期开始。在这一阶段中,计算机技术获得了更快的发展,并更加广泛地与其它学科技术相互结合、相互渗透,在数据库领域中诞生了很多高新技术,并产生了许多新型数据库,如:分布式数据库和面向对象的数据库。

  • 第16题:

    数据管理技术的发展是与计算机技术及其应用的发展联系在一起的。当前分布式数据库、面向对象数据库等新型数据库属于______。

    A.人工管理阶段

    B.文件系统阶段

    C.数据库系统阶段

    D.高级数据库技术阶段


    正确答案:D

  • 第17题:

    数据管理技术的发展是与计算机技术及其应用的发展联系耷一起的,经历了由低级到高级的发展过程。分布式数据库、面向对象数据库等新型数据库是属于哪个发展阶段的? ( )。

    A.人工管理阶段

    B.文件系统阶段

    C.数据库系统阶段

    D.高级数据库技术阶段


    正确答案:D
    解析:人工管理阶段和文件系统阶段不存在数据库管理,网状、层次、关系等数据库属于数据库系统阶段,而分布式数据库、面向对象数据库等是新型的数据,属于第三代数据库系统、高级数据库技术阶段。

  • 第18题:

    数据管理技术的发展是与计算机肢术及其应用的发展联系在一起的,经历了由低级到高级的发展。分布式数据库、面向对象数据库等新型数据库属于哪—个发展阶段?

    A.人工管理阶段

    B.文件系统阶段

    C.数据库系统阶段

    D.高级数据库技术阶段


    正确答案:D
    解析:高级数据库技术阶段大约从20世纪70年代后期开始。在这一阶段中,计算机技术获得了更快的发展,并更加广泛地与其他学科技术相互结合、相互渗透,在数据库领域中诞生了很多高新技术,并产生了许多新型数据库,如:分布式数据库和面向对象的数据库。

  • 第19题:

    数据管理技术的发展是与计算机技术及其应用的发展联系在一起的,经历了由低级到高级的发展。分布式数据库、面向对象数据库等新型数据库属于哪一个发展阶段?


    正确答案: 高级数据库技术阶段。

  • 第20题:

    在“金信工程”建设过程中,将采取分步走的方针实现总局数据中的数据量的测算,总局将建设()等主题型数据库。

    • A、全国企业身份基础信息数据库数据量测算、12315消费者申投诉统计分析数据库数据量测算
    • B、总局基本业务信息数据库数据量测算、全国动产抵押物数据库数据测量
    • C、全国黑牌企业及负责人数据库数据量估算、重要商品监测数据库数据量测算
    • D、商标服务数据库数据量估算和全国外商投资企业管理数据库数据量估算

    正确答案:A,B,C,D

  • 第21题:

    ERP是基于数据库技术的软件产品,它是指()。

    • A、企业数据库应用系统
    • B、数据库开发工具
    • C、数据库管理系统
    • D、分布式数据库系统

    正确答案:A

  • 第22题:

    促进信息资源管理产生的主要因素有()

    • A、科技进步
    • B、“信息爆炸”
    • C、数据库管理等应用学科的发展
    • D、数据压缩技术的发展
    • E、信息资源地位的提高

    正确答案:B,C,E

  • 第23题:

    多选题
    在“金信工程”建设过程中,将采取分步走的方针实现总局数据中的数据量的测算,总局将建设()等主题型数据库。
    A

    全国企业身份基础信息数据库数据量测算、12315消费者申投诉统计分析数据库数据量测算

    B

    总局基本业务信息数据库数据量测算、全国动产抵押物数据库数据测量

    C

    全国黑牌企业及负责人数据库数据量估算、重要商品监测数据库数据量测算

    D

    商标服务数据库数据量估算和全国外商投资企业管理数据库数据量估算


    正确答案: A,B,C,D
    解析: 暂无解析