试题四(共 25 分)阅读以下关于数据集成的叙述,在答题纸上回答问题 1 至问题3。某互联网销售企业需要建立自己的电子商务平台,将所有产品信息集中在一起,为用户提供全方位的产品信息检索服务。但产品供应商大多数已经建有自己的电子商务平台,且数据独立存储,而且数据格式和数据平台有较大差异,有的供应商甚至没有采用数据库来存储商品信息。为此该企业专门成立专家组来论证其数据集成方案。李工提出采用集中式集成方式把产品供应商的数据集中在一起,采用数据仓库技术来实现与各家供应商的数据集成。而王工提出采用松耦合的联邦数据库

题目

试题四(共 25 分)

阅读以下关于数据集成的叙述,在答题纸上回答问题 1 至问题3。

某互联网销售企业需要建立自己的电子商务平台,将所有产品信息集中在一起,为用户提供全方位的产品信息检索服务。但产品供应商大多数已经建有自己的电子商务平台,且数据独立存储,而且数据格式和数据平台有较大差异,有的供应商甚至没有采用数据库来存储商品信息。为此该企业专门成立专家组来论证其数据集成方案。

李工提出采用集中式集成方式把产品供应商的数据集中在一起,采用数据仓库技术来实现与各家供应商的数据集成。而王工提出采用松耦合的联邦数据库集成方案。专家组经过激烈讨论,认为王工方案更为合理,建议采用王工提出的集成方案。

【问题 1】(10 分)

请结合数据仓库和联邦数据库集成方案各自的特点,简要说明专家组采用王工提出的集成方案的原因。

【问题 2】(7 分)

部分供应商的产品信息没有相应的数据库,而是直接嵌入在 WEB 页面中供用户浏览。数据集成时需要直接从供应商电子商务平台的网页上获取其产品信息。请简要给出此类数据集成的方法和基本步骤。

【问题 3】(8 分)

在方案评审会上,项目组针对李工和王工的方案展开了激烈的讨论。刘工指出两种方案在实施的过程中,都存在数据源之间的语义映射和转换问题,都会带来数据集成的不确定。请简要说明产生不确定的原因。


相似考题

2.请详细阅读有关数据架构方面的描述,回答问题1至问题3。 【说明】 某软件公司欲开发一个基于Web 2.0的大型社交网络系统。就该系统的数据架构而言,李工决定采用公司熟悉的数据架构,使用通用的商用关系型数据库,系统内部数据采用中央集中方式存储。 该系统投入使用后,初期用户数量少,系统运行平稳。6个月后,用户数出现了爆炸式增长,系统暴露出诸多问题,集中表现在: (1)用户执行读写操作时,响应时间均变得很慢; (2)随着系统功能的扩充,原有数据格式发生变化,又出现新的数据格式,维护困难; (3)数据容量很快超过系统原有的设计上限,数据库扩容困难; (4)软件系统不断出现宕机,整个系统可用性较差。 经过多次会议讨论,公司的王工建议采用NoSQL数据库来替代关系数据库,以解决上述问题。但李工指出NoSQL数据库出现时间不长,在使用上可能存在风险。公司技术人员对NoSQL数据库产品进行了认真测试,最终决定采用NoSQL数据库来替代现有的数据库系统。【问题1】(11分) 分别解释产生问题(1)~(4)的原因。 【问题2】(8分) 请针对问题(1)~(4),分别指出NoSQL数据库的哪些特点促使公司最终采用了NoSQL数据库。 【问题3】(6分) 请指出该系统采用NoSQL数据库时可能存在的问题。

4.试题四(共25分)阅读以下关于系统设计与开发工具集成的说明,在答题纸上回答问题1至问题 3。【说明】TeleDev是一个大型的电信软件开发公司,公司内部采用多种商业/开源的工具进行软件系统设计与开发工作。为了提高系统开发效率,公司管理层决定开发一个分布式的系统设计与开发工具集成框架,将现有的系统设计与开发工具有效集成在一起。集成框架开发小组经过广泛调研,得到了如下核心需求:(1)目前使用的系统设计与开发工具的运行平台和开发语言差异较大,集成框架应无缝集成各个工具的功能;(2)目前使用的系统设计与开发工具所支持的通信协议和数据格式各不相同,集成框架应实现工具之间的灵活通信和数据格式转换;(3)集成框架需要根据实际的开发流程灵活、动态地定义系统工具之间的协作关系;(4)集成框架应能集成一些常用的第三方实用工具,如即时通信,邮件系统等。集成框架开发小组经过分析与讨论,最终决定采用企业服务总线(ESB)作为集成框架的基础架构。【问题1】 (8分)ESB 是目前企业级应用集成常用的基础架构。请列举出 ESB 的 4 个主要功能,并从集成系统的部署方式、待集成系统之间的耦合程度、集成系统的可扩展性 3 个方面说明为何采用ESB作为集成框架的基础架构。【问题2】 (12分)在 ESB 基础架构的基础上,请根据题干描述中的 4 个需求,说明每个需求应该采用何种具体的集成方式或架构风格最为合适。【问题3】 (5分)请指出在实现工具之间数据格式的灵活转换时,通常采用的设计模式是什么,并对实现过程进行简要描述。

更多“试题四(共 25 分)阅读以下关于数据集成的叙述,在答题纸上回答问题 1 至问题3。某互联网销售企业需要建立自己的电子商务平台,将所有产品信息集中在一起,为用户提供全方位的产品信息检索服务。但产品供应商大多数已经建有自己的电子商务平台,且数据独立存储,而且数据格式和数据平台有较大差异,有的供应商甚至没有采用数据库来存储商品信息。为此该企业专门成立专家组来论证其数据集成方案。李工提出采用集中式集成方式把产品供应商的数据集中在一起,采用数据仓库技术来实现与各家供应商的数据集成。而王工提出采用松耦合的联邦数据库”相关问题
  • 第1题:

    阅读以下关于企业应用集成的叙述,在回答问题1至问题3。

    某软件公司承担了某大型企业应用系统集成任务,该企业随着信息化的进展,积累了许多异构的遗产信息系统,这些系统分别采用J2EE、.NET等技术进行开发,分布在不同的地理位置,采用不同的协议进行数据传输。企业要求集成后的系统能够实现功能整合,并在组织现有功能的基础上提供增值服务。为了按时完成任务,选择合适的企业应用集成方法和架构非常重要。项目组在讨论方案时,提出了两种集成思路。

    (1)刘工建议采用传统的应用集成方法,将应用集成分为多个层次,并采用消息代理中间件连接遗产系统。

    (2)王工建议采用基于SOA的方法进行应用集成,将现有遗产系统采用Web Service的方式进行包装,暴露统一格式的接口,并采用企业服务总线(ESB)进行连接。

    项目组仔细分析比较了两种方案的优点和不足后,认为刘工和王工的建议都合理,但是结合当前项目的实际情况,最后决定采用王工的建议。

    请分析比较两种方案优点和不足,完成表1-1中的空白部分。


    正确答案:(1)将现有系统看作抽象的服务的提供者集成方法统一明确; (2)不同层次的集成方法关注点不同功能组合方面能力较弱; (3)一般为中心辐射型(hub-and-spoke)系统之间的耦合度较高; (4)集成系统具有模块化松耦合的特点可扩展性较好。
    (1)将现有系统看作抽象的服务的提供者,集成方法统一明确; (2)不同层次的集成方法关注点不同,功能组合方面能力较弱; (3)一般为中心辐射型(hub-and-spoke),系统之间的耦合度较高; (4)集成系统具有模块化,松耦合的特点,可扩展性较好。 解析:该问题考查的是在进行企业应用集成时,采用传统的多层划分、基于中间件集成方式和与基于SOA的集成方式的特点比较,主要强调基于SOA思想在应用集成中的优势。需要注意的是,如果企业只是进行小规模或较浅层次的“战术”级应用集成,采用传统的集成方式即可较好的完成任务,但是如果企业想从集成系统的灵活性和可扩展角度考虑,能够持续地集成已有信息系统,并进行“战略”意义上的长远规划,那么面向服务的架构无疑是一种更加优越的方法。采用SOA的思想进行应用集成,企业现有的应用系统都可以看作广义上的服务提供者,因此(1)处应该填写“将现有系统看作抽象的服务的提供者,集成方法统一明确”,这个答案要强调两点:一是服务提供者,二是集成方式统一;传统的应用集成方式往往采用分层的方式对待整个集成活动,因此在(2)处应该填写“不同层次的集成方法关注点不同,功能组合方面能力较弱”:对于(3),传统的集成方式大多会采用中心辐射型的集成架构,系统的耦合程度较高;对于(4),由于在面向服务的体系结构中,服务是统一的抽象模块,因此集成系统具有模块化、松耦合的特点,可扩展性较强。

  • 第2题:

    阅读以下关于数据库备份与恢复方面的叙述,回答问题1至问题4。

    银行金融系统对数据库中的数据安全要求很高,必须在技术层面上采用必要的措施,以保证数据的有效和不丢失。数据库的备份与恢复是保证数据安全的一种基本方法,一般将数据库备份划分为冷备份、热备份和数据导出,而数据导出根据导出数据的范围,又可以分为完全导出、增量导出和累计导出。

    该金融系统上线初期,整个业务系统采用了内网方式运行,不与外网发生联系。为了保证数据库内部数据的安全,该银行信息中心的刘工提出的备份方案如表4-1所示。

    信息中心的李工对刘工的方案提出了异议,认为数据库一旦发生故障,刘工的方案无法做到数据库的实时恢复,会导致业务数据的丢失,银行应该采用数据库冷备份和热备份相结合的方式来完成数据库的备份。

    针对金融数据库安全,从技术层面上分析应重点考虑哪些因素?


    正确答案:对数据库内部故障的考虑包括事务故障、系统故障和介质故障。 对数据库外部各种攻击的考虑包括计算机病毒、利用软件漏洞的黑客攻击和SQL注入攻击等。
    对数据库内部故障的考虑,包括事务故障、系统故障和介质故障。 对数据库外部各种攻击的考虑,包括计算机病毒、利用软件漏洞的黑客攻击和SQL注入攻击等。 解析:本题考查数据库备份与恢复的基本知识,属于比较传统的题目。
    本问题考查从技术角度上需要考虑的基本内容。一般而言,是从数据库内外两个角度来讲。从数据库内部来讲,主要是数据库故障引起的,故障一般分为事务故障、系统故障和介质故障:从数据库外部来讲,主要是指外部对数据库的攻击,主要是计算机病毒,以及近几年比较流行的利用软件漏洞的黑客攻击和SQL注入攻击等。

  • 第3题:

    数据集成是数据仓库建立的重要环节,下列关于数据集成的说法,错误的是( )。

    A.数据集成就是把企业里的所有数据集成到数据仓库中

    B.数据集成不仅涉及技术问题,也经常涉及管理问题

    C.集成时需要将来自不同数据源的数据按目标要求进行格式转换

    D.数据集成的一个重要目的是合理地组织企业数据,实现企业级数据视图


    参考答案:A

  • 第4题:

    试题四(共25分)

    阅读以下关于数据库架构设计的叙述,回答问题1至问题3。

    某软件公司欲开发一个社交网络系统,该系统能够接收多个不同种类客户端发送的信息,并将这些信息实时显示在每个客户端的页面上供客户阅读。该系统将为数以百万计的用户服务,因此,要求采用的数据库能够支持大量信息存储,能够满足并发读写要求,并要求随着数据规模的扩大,数据库系统要易于进行扩充。关于数据库架构的设计,王工和张工提出了两种模式:王工提出基于传统的关系型数据库模式,通过向上扩展( Scale-up)以满足数据库的可扩展性要求;李工提出利用新兴的NoSQL数据库模式,通过向外扩展( Scale-out)以满足数据库的可扩展性要求。项目组经过讨论,决定采用李工提出的设计方案。

    【问题1】(11分)

    请指出关系数据库模式和NoSQL模式在并发支持、存储与查询、扩展方式、索引方式和应用领域五个方面各自的特点,结果填入表4-1中(1)~(10);并针对应用需求,说明项目组选择李工提出的设计方案的原因。

    【问题2】(8分)

    与传统的关系型数据库相比,NoSQL数据库所支持的典型数据存储类型有哪些?

    【问题3】(6分)

    在实际应用中,NoSQL数据库存在的问题有哪些?


    正确答案:

    试题四分析
    传统关系型数据库在需要处理大规模并发数据访问的社交网络应用场景下,暴露出了很多问题,例如需要很高的实时插入性能;需要海量的数据存储能力同时还需要非常快的查询和检索速度;需要将数据存储无缝扩展到整个集群环境下,并且能够支持在线扩展等。NoSQL数据库模式打破了传统关系型数据库的范式约束、SQL查询语言和事务一致性,实现了以键值数据格式存储的Hash数据库。
    本问题主要考查应试者对于关系型数据库和NoSQL数据模式的掌握情况,特别是关系型数据库和NoSQL数据库模式的特点和实现方式。本题结合一个典型的实际项目案例,首先要求应试者分析关系型数据库和NoSQL模式之间的异同,然后针对系统需求分析采用NoSQL数据库模式的原因;针对NoSQL数据库模式的典型应用,列举出其能够支持的数据存储方式及其特点;最后分析在实际应用中还需要在哪些方面进行改进以提升其应用效果。
    【问题1】
    本问题要求考生针对关系数据库模式和NoSQL模式的特点进行分析。关系数据库利用加锁机制支持并发操作,执行效率较低,利用关系表的方式存储数据,通过SQL语言和数据库进行交互,主要通过提升硬件配置等向上扩展方式提升性能,B树和哈希是常用的索引结构,其能够广泛应用于多个领域;NoSQL作为新兴的数据库模式处理并发的效率较高,支持海量数据存储和查询,利用增加分布存储的数据库节点数目扩展性能,主要以键值方式存储数据,在对于大规模并发数据处理的分布式应用中有更好的表现。
    根据项目的实际应用需求,所以采用NoSQL模式更为合适。
    【问题2】
    本问题要求考生掌握NoSQL数据模式所支持的数据类型。常见的数据类型包括表格/列存储、文档存储、图像存储、键值存储、对象和多值存储等。
    【问题3】
    本问题要求应试者分析NoSQL数据库模式在实际应用中的不足之处。作为一种新兴的数据库模式,其实现的完整性、应用范围和专业知识等与成熟的关系型数据库相比还有一定的差距。
    参考答案
    【问题1】
    关系数据库模式和NoSQL模式的特点比较:

    选择李工方案的原因分析:
    (1)社交网络系统对于数据库并发负载要求非常高,对于数量较大的数据库并发写要求,关系型数据库难以满足;
    (2)海量数据的高效率存储和访问需求,数百万账号信息,关系型数据库查询效率很低;
    (3)可扩展性需求,可以通过增加更多的服务器节点来实现扩展。
    【问题2】
    MySQL数据库支持的数据存储类型有:
    (1)表格/列存储:存储稀疏表格数据,类似于传统的二维表格式存储;
    (2)文档存储:用于存储非结构化或半结构化文件;
    (3)图像存储:利用节点、边和属性的方式存储图片类数据,常被用于存储社交网络服务中;
    (4)键值存储:类似哈希表一样存储简单的键值对,有基于内存和基于磁盘两种实现方式;
    (5)对象和多值存储:对象数据库存储面向对象语言中的对象,多值数据库存储表格型数据,每个单元格中可存储多个值。
    【问题3】
    NoSQL数据库存在的问题是:
    (1)成熟度不够,大量关键特性有待实现;
    (2)开源数据库产品的支持力度有限;
    (3)数据挖掘与商务智能支持不足,现有的产品无法直接使用NoSQL数据库;
    (4) NoSQL数据库专家较少,大部分都处于学习阶段。

  • 第5题:

    共享数据库是一种重要的企业应用集成方式。以下关于共享数据库集成方式的叙述中,错误的是()。

    A. 共享数据库集成方式通常将应用程序的数据存储在一个共享数据库中,通过制定统一的数据库模式来处理不同应用的集成需求
    B.共享数据库为不同的应用程序提供了统一的数据存储与格式定义,能够解决不同应用程序中数据语义不一致的问题
    C.多个应用程序可能通过共享数据库频繁地读取和修改相同的数据,这会使共享数据库成为一个性能瓶颈
    D.共享数据库集成方式的一个重要限制来自外部的已封装应用,这些封装好的应用程序只能采用自己定义的数据库模式,调整和集成余地较小

    答案:B
    解析:
    本题考核应用集成的方式。

  • 第6题:

    阅读以下关于数据库分析与建模的叙述,在答题纸上回答问题 1至问题 3。

    【说明】

    某电子商务企业随着业务不断发展,销售订单不断增加,每月订单超过了 50 万笔,急需开发一套新的互联网电子订单系统。同时该电商希望建立相应的数据中心,能够对订单数据进行分析挖掘,以便更好地服务用户。王工负责订单系统的数据库设计与开发,初步设计的核心订单关系模式为:orders(order_no,customer_no ,order_date,product_no,price,. ....);

    考虑订单数据过多,单一表的设计会对系统性能产生较大影响,仅仅采用索引不足以解决性能问题。因此,需要将订单表拆分,按月存储。

    王工采用反规范化设计方法来解决,给出了相应的解决方案。李工负责数据中心的设计与开发。李工认为王工的解决方案存在问题,建议采用数据物理分区技术。在解决性能问题的同时,也为后续的数据迁移、数据挖掘和分析等工作提供支持。

    【问题 1】 (8 分)

    常见的反规范化设计包括增加冗余列、增加派生列、重新组表和表分割。为解决题干所述需求,王工采用的是哪种方法?请用 300 字以内的文字解释说明该方法,并指出其优缺点。

    【问题 2】 (8 分)

    物理数据分区技术一般分为水平分区和垂直分区,数据库中常见的是水平分区。水平分区分为范围分区、哈希分区、列表分区等。请阅读下表,在(1)~(8) 中填写不同分区方法在数据值、数据管理能力、实施难度与可维护性、数据分布等方面的特点。

    【问题 3】(9 分)

    根据需求,李工宜选择物理水平分区中的哪种分区方法?请用 300字以内的文字分别解释说明该方法的优缺点。


    答案:
    解析:
    【问题 1】 (8 分)

    答案:

    王工采用的是表分割方式中的水平分割(分割参数是:“月”)

    表分割包括水平分割与垂直分割两种形式:

    水平分割:按记录进行分割,不同的记录可以分开保存,每个子表的列数相同。分割的条件可能是某列或多列数据的值,如时间参数。

    垂直分割:按进行分割,即把一条记录分开多个地方保存,每个子表的行数相同。把主键和一些行放到一个表,然后把主键和另外的列放到另一个表中,通过主键进行关联。

    优点:水平分割后可以降低在查询时需要读取的数据和索引页数,同时也降低了索引的层数,提高查询速度。

    缺点:水平分割会给应用增加复杂度,在查询时需要多个表名,查询所有数据需要union操作。

    【问题 2】 (8 分)

    答案:(1)连续(2)离散(3)弱(4)强(5)好(6)好(7)不均匀(8)均匀

    【问题 3】(9 分)

    答案:

    李工宜选择范围分区方式。

    范围分区优点:

    1、分区表可以将表存储到多个表空间内,各个分区维护各自的本地索引,查询语句可以根据索引进行分区范围查找,提高了查询速度;

    2、可以对单个分区进行备份、归档或者清除过期的数据,利于维护;

    3、实现容易,而且可以方便的对表的分区进行添加、删除、拆分和合并操作。

    范围分区缺点:数据分布不均匀所以可以与哈希分区组合应用。

  • 第7题:

    阅读以下关于数据管理的叙述,在答题纸上回答问题 1 至问题 3。【说明】某软件企业开发了一套新闻社交类软件,提供常见的新闻发布、用户关注、用户推荐、新闻点评、新闻推荐、热点新闻等功能,项目采用 MySQL 数据库来存储业务数据。系统上线后,随着用户数量的增加,数据库服务器的压力不断加大。为此,该企业设立了专门的工作组来解决此问题。张工提出对 MySQL 数据库进行扩展,采用读写分离,主从复制的策略,好处是程序改动比较小,可以较快完成,后续也可以扩展到 MySQL 集群,其方案如图4-1 所示。李工认为该系统的诸多功能,并不需要采用关系数据库,甚至关系数据库限制了功能的实现,应该采用 NoSQL 数据库来替代 MySQL,重新构造系统的数据层。而刘工认为张工的方案过于保守,对该系统的某些功能,如关注列表、推荐列表、热搜榜单等实现困难,且性能提升不大;而李工的方案又太激进,工作量太大,短期无法完成,应尽量综合二者的优点,采用 Key-Value 数据库+MySQL数据库的混合方案

    经过组内多次讨论,该企业最终决定采用刘工提出的方案。问题内容:【问题 1】(8 分)张工方案中采用了读写分离,主从复制策略。其中,读写分离设置物理上不同的主/从服务器,让主服务器负责数据的(a)操作,从服务器负责数据的(b)操作,从而有效减少数据并发操作的(c),但却帯来了(d)。因此,需要采用主从复制策略保持数据的(e)。MySQL 数据库中,主从复制是通过 binary log 来实现主从服务器的数据同步,MySQL 数据库支持的三种复制类型分别是(f) 、 (g) 、 (h)。请将答案填入(a)~(h)处的空白,完成上述描述。【问题 2】(8 分)李工方案中给出了关系数据库与 NoSQL 数据的比较,如表 4-1 所示,以此来说明该新闻社交类软件更适合采用 NoSQL 数据库。请完成表 4-1 中的(a) ~ (d)处空白。表 4-1 关系数据库与 NoSQL 数据库特征比较

    【问题 3】(9 分)刘工提出的方案采用了 Key-Value 数据库+MySQL 数据库的混合方案,是根据数据的读写特点将数据分别部署到不同的数据库中。但是由于部分数据可能同时存在于两个数据库中,因此存在数据同步问题。请用 200 字以内的文字简要说明解决该数据同步问题的三种方法。


    答案:
    解析:
    【问题1】(a)写(b)读(c)延迟(d)数据不一致(e)一致性(或同步)(f)(g)(h)次序无关基于SQL语句的复制(SBR: statement-based replication)基于行的复制(RBR: row-based replication)混合模式复制(MBR: mixed-based replication)【问题2】(a)弱一致性(b)非结构化(c)弱事务性(d)海量数据【问题3】1、通过定时任务做数据定期同步;2、通过触发器实现数据同步;3、通过数据库插件实现数据同步。

  • 第8题:

    试题四 (共 2S 分)阅读以下关于数据库设计的叙述,在答题纸上回答问题 1 至问题 3。【说明】某制造企业为拓展网上销售业务,委托某软件企业开发一套电子商务网站。初期仅解决基本的网上销售、订单等功能需求。该软件企业很快决定基于.NET 平台和 SQL Server 数据库进行开发,但在数据库访问方式上出现了争议。王工认为应该采用程序在线访问的方式访问数据库:而李工认为本企业内部程序员缺乏数据库开发经验,而且应用筒单,应该采用 ORM<对象关系映射>方式。最终经过综合考虑,该软件企业采用了李工的建议。随着业务的发展,该电子商务网站逐渐发展成一个通用的电子商务平台,销售多家制造企业的产品,电子商务平台的功能也日益复杂。目前急需对该电子商务网站进行改造,以支持对多种异构数据库平台的数据访问,同时满足复杂的数据管理需求。该软件企业针对上述需求,对电子商务网站的架构进行了重新设计,新增加了数据访问层,同时采用工厂设计模式解决异构数据库访问的问题。新设计的系统架构如图 4-1 所示。

    【问题 1】 (9 分)请用 300 字以内的文字分别说明数据库程序在线访问方式和 ORM 方式的优缺点,说明该软件企业采用 ORM 的原因。
    【问题 2】 (9 分)请用 100 宇以内的文字说明新体系架构中增加数据访问层的原因。请根据图 4-1 所示,填写图中空白处(1) - (3)。【问题 3】 (7 分) -应用程序设计中,数据库访问需要良好的封装性和可维护性,因此经常使用工厂设计模式来实现对数据库访问的封装。请解释工厂设计模式,并说明其优点和应用场景: 请解释说明工厂模式在数据访问层中的应用。请用 100 宇以内的文字说明新体系架构中增加数据访问层的原因。请根据图 4-1 所示,填写图中空白处(1) - (3)。


    答案:
    解析:
    数据库程序在线访问方式优点:1. 性能比直接SQL好;2. 可以处理复杂的查询语句。数据库程序在线访问方式不足:1. 程序员必须懂SQL语句;2. 修改维护相对困难。 ORM方式优点:1. 降低学习和开发成本;2. 程序员不用再写SQL进行数据库操作;3. 减少程序代码量;4. 降低由于SQL代码质量差带来的影响。 ORM方式缺点:1. 性能比直接用SQL差2. 处理复杂查询比较困难。 采用ORM原因:(1)缺乏数据库开发经验,因此SQL语句编写质量有潜在风险;(2)学习成本高;(3)应用比较简单,没有太复杂功能。参考答案:(1)涉及多种异构数据库平台,数据访问复杂性增加,不宜与业务逻辑混合在一起;(2)数据管理变复杂之后,需要使用代码量增加,分层次有利于逻辑更加清晰,程序维护更加方便;(3)业务逻辑应以相同的方式应对异构数据库,为了做好隐蔽性需要单独设计数据访问层。 (1)~(3)分别填入:执行业务逻辑 、工厂层(factory)、数据访问接口层。工厂模式分为:抽象工厂和工厂方法,本题为抽象工厂设计模式。抽象工厂设计模式提供一个接口,可以创建一系列或相互依赖的 对象,而无需指定他们具体的类。优点:方便创建一系列的对象,其使用场景也是创建系列对象的情况。该题目中,可以针对oracle,mysql,sqlserver分别抽象建立抽象工厂,若指定当前工厂为oracle工厂,则创建出来的数据库连接,数据集等一系列对象都是符合oracle操作要求的,这样便于数据库之间的切换。

  • 第9题:

    阅读以下关于数据集成的叙述,在答题纸上回答问题 1 至问题3。
    某互联网销售企业需要建立自己的电子商务平台,将所有产品信息集中在一起,为用户提供全方位的产品信息检索服务。但产品供应商大多数已经建有自己的电子商务平台,且数据独立存储,而且数据格式和数据平台有较大差异,有的供应商甚至没有采用数据库来存储商品信息。为此该企业专门成立专家组来论证其数据集成方案。
    李工提出采用集中式集成方式把产品供应商的数据集中在一起,采用数据仓库技术来实现与各家供应商的数据集成。而王工提出采用松耦合的联邦数据库集成方案。专家组经过激烈讨论,认为王工方案更为合理,建议采用王工提出的集成方案。
    【问题 1】(10 分)
    请结合数据仓库和联邦数据库集成方案各自的特点,简要说明专家组采用王工提出的集成方案的原因。
    【问题 2】(7 分)
    部分供应商的产品信息没有相应的数据库,而是直接嵌入在 WEB 页面中供用户浏览。数据集成时需要直接从供应商电子商务平台的网页上获取其产品信息。请简要给出此类数据集成的方法和基本步骤。
    【问题 3】(8 分)
    在方案评审会上,项目组针对李工和王工的方案展开了激烈的讨论。刘工指出两种方案在实施的过程中,都存在数据源之间的语义映射和转换问题,都会带来数据集成的不确定。请简要说明产生不确定的原因。


    答案:
    解析:
    【问题1】
    数据仓库集成是把多种来源的数据集中在一起,建立数据仓库,所有数据都驻留在单个数据库服务器上,配置大型处理器和存储容量。数据仓库主要用于决策支持,在数据处理过程中强调分析。其特点是:
    (1)集成的数据。
    (2)面向主题。
    (3)数据相对稳定。
    (4)包含历史信息。
    联邦数据库集成是把多个数据库系统联合在一起,构成"联邦数据库系统",数据库之间通过接口查询,互相通信,数据分布在不同地方的计算机或数据库服务器上,通过网络连接。其特点是:
    (1)联邦数据库提供集成的数据格式,对用户提供统一的访问,屏蔽了各个数据库的复杂性和分布情况,简化了开发数据库查询和对数据统一理解的工作。这种分布式的数据集成,更加符合应用系统的实际情况。
    (2)异构数据源不仅仅是数据库系统,通过中间件,可以扩展到传感器、文件和应用程序等。
    【问题2】
    此类数据往往是非结构化或者半结构化的,但同一个数据源往往有统一的页面模式,因此应该采用Web内容提取(挖掘/文本挖掘)的集成方法来获取对应供应商的产品信息。
    其基本步骤为:
    (1)分析页面,确定其页面中的数据模式。
    (2)抓取页面,通过爬虫技术获取对应的网页。
    (3)特征提取与处理,获取相应数据。
    (4)数据清洗,根据规则进行判断,抛弃异常数据。
    (5)数据转换,根据顶先定义好的语义映射关系,将数据转换为统一格式。
    【问题3】
    数据集成系统依靠模式映射来指明数据源中的数据和中介所用数据之间的语义关系,但映射过程中可能发生不确定性,其原因有:
    (1)数据源与中介模式之间的语义映射可能是近似的。
    (2)用户不熟悉模式或系统的域太宽,不能提供基于表单式的查询接口,需要使用关键字查询,但将关键字查询转换成一组候选的结构化查询时,会带来不确定性。
    (3)数据常常是使用信息获取技术从非结构化数据源获取的,而这些获取技术一般只是"大致可用",所取得的数据可能是不确定的。
    【解析】

    本题主要考查数据集成中的数据仓库方案和联邦数据库方案的内容。
    【问题1】
    本问题考查数据仓库和联邦数据库集成方案的基本概念。数据仓库集成是把多种来的数据集中在一起,建立数据仓库,所有数据都驻留在单个数据库服务器上,配置大型处理器和存储容量。数据仓库主要用于决策支持,在数据处理过程中强调分析。其特点是:①集成的数据;②面向主题;③数据相对稳足;④包含历史信息。但是此种集成方法中需要将数据源的数据转换为数据仓库中的语义,而且需要定期的数据复制和数据更新。数据源往往指的是数据库系统。
    联邦数据库集成是把多个数据库系统联合在一起,构成"联邦数据库系统",数据之间通过接口查询,互相通信,数据分布在不同地方的计算机或数据库服务器上,通过网络连接。其特点是:①联邦数据库提供集成的数据格式,对用户提供统一的访问,屏蔽了各个数据库的复杂性和分布情况,简化了开发数据库查询和对数据统一理解的工作。这种分布式的数据集成,更加符合应用系统的实际情况。②异构数据源不仅仅是数据库系统,通过中间件,可以扩展到传感器、文件和应用程序等。
    两种方式都需要将数据源中的数据语义转换为统一数据语义,这种转换往往存在不定性。
    【问题2】
    本问题考查Web内容提取或Web数据挖掘的相关知识。Web信息系统中的数据往住是非结构化或者半结构化的,但同一个数据源往往有统一的页面模式,但是其数据呈现是嵌入在页面中。因此需要采用Web内容提取(挖掘/文本挖掘)的集成方法来获取对应供应商的产品信息。
    其基本的步骤是:
    (1)分析页面,确定其页面中的数据模式。制定数据挖掘的特征和提取规则,编写特定的页面分析和数据提取程序。
    (2)抓取页面,通过爬虫技术获取对应的网页。将远端的页面下载到本地进行存储,为后续数据提取做准备。
    (3)特征提取与处理,获取相应数据,依据的原则是分析页面阶段所形成的特征和提取规则。
    (4)数据清洗,根据规则进行判断,抛弃异常数据。
    (5)数据转换,根据预先定义好的语义映射关系,将数据转换为统一格式。
    Web内容提取的算法程序本身是近似的,因此在获取数据的内容上存在不确定性。
    【问题3】
    本问题考查在数据集成过程存在的不确定性问题。问题1和问题2中实际己经明确了集成过程中存在不确定性。主要的原因在于数据集成系统依靠模式映射来指明数据源中的数据和中介所用数据之间的语义关系,但映射过程中可能发生不确定性。具体原因有:
    (1)数据源与中介模式之间的语义映射可能是近似的。实际系统中往往很难有非常精确、完整的语义映射。
    (2)用户不熟悉模式或系统的域太宽,不能提供基于表单式的查询接口,需要使用关键字查询,但将关键字查询转换成一组候选的结构化查询时,会带来不确定性。
    (3)数据常常是使用信息获取技术从非结构化数据源获取的,而这些获取技术一般只是"大致可用",所取得的数据可能是不确定的。
    因此,在本试题中,无论采用数据仓库或者联邦数据库集成方案,都存在数据源之间的语义映射和转换问题,都会带来数据集成的不确定。

  • 第10题:

    “大集中”征管系统中实现准实时访问、存储短期历史数据、面向查询统计的集成视图是()。

    • A、OLTP生产库
    • B、ODS运作数据库
    • C、DW数据仓库
    • D、LDAP数据库

    正确答案:B

  • 第11题:

    某企业拥有多个应用系统,分别采用不同的语言和平台独立构建而成,企业需要集成来自不同系统的数据,并使用可定制格式的数据频繁地、立即地、可靠地、异步地传输数据。以下集成方式最能满足这种要求的是()

    • A、文件共享
    • B、数据库共享
    • C、远程方法调用
    • D、消息机制

    正确答案:D

  • 第12题:

    填空题
    CAD/CAM信息(数据)集成的实现方式有:基于专用数据格式文件集成(),基于数据库集成。

    正确答案: 中性(标准)格式数据交换文件
    解析: 暂无解析

  • 第13题:

    试题四(共25分)

    阅读以下Web应用系统架构设计的说明,在答题纸上回答问题1至问题3。

    【说明】

    某公司拟开发一个市场策略跟踪与分析系统,根据互联网上用户对公司产品信息的访问情况和产品实际销售情况来追踪各种市场策略的效果。其中互联网上用户对公司产品信息的访问情况需要借助两种不同的第三方Web分析软件进行数据采集与统计,并生成不同格式的数据报表;公司产品的实际销售情况则需要通过各个分公司的产品销售电子表格或数据库进行采集与汇总。得到相关数据后,还要对数据进行分析与统计,并通过浏览器以在线的方式向市场策略制定者展示最终的市场策略效果。

    在对市场策略跟踪与分析系统的架构进行设计时,公司的架构师王工提出采用面向服务的系统架构,首先将各种待集成的第三方软件和异构数据源统一进行包装,然后将数据访问功能以标准Web服务接口的形式对外暴露,从而支持系统进行数据的分析与处理,前端则采CSS等技术实现浏览器数据的渲染与展示。架构师李工则认为该系统的核心在于数据的定位、汇聚与转换,更适合采用面向资源的架构,即首先为每种数据元素确定地址,然后将各种数据格式统一转换为JSON格式,通过对JSON数据的组合支持数据的分析与处理任务,处理结果经过渲染后在浏览器的环境中进行展示。在架构评估会议上,专家对这两种方案进行综合评价,最终采用了李工的方案。

    【问题1】(7分)

    请根据题干描述,对市场策略跟踪与分析系统的数据源特征与数据操作方式进行分析,完成表4-1中的(1)~(3),并用200字以内的文字说明李工方案的优点。

    【问题2】 (12分)

    请从数据获取方式、数据交互方式和数据访问的上下文无关性三个方面对王工和李工的方案进行比较,并用500字以内的文字说明为什么没有采用王工的方案。

    【问题3】(6分)

    表现层状态转换( REST)是面向资源架构的核心思想,请用200字以内的文字解释什么是REST,并指出在REST中将哪三种关注点进行分离。


    正确答案:

    试题四
    【问题1】

    通过对系统的数据源特征和数据操作方式进行分析可以看出,待集成的数据均为持久型数据(文件或数据库),系统对数据的访问均为只读非实时性的。针对上述应用特征,李工提出的面向资源的架构方式以对数据资源的只读访问为核心,通过数据唯一标识直接对各种数据进行访问与获取,系统架构清晰、实现简单、效率较高。
    【问题2】
    从数据获取方式看,王工的方案需要将现有的多个系统和异构的数据源包装为服务,采用Web服务暴露数据接口,客户端需要通过服务调用获取数据,这种方法工作量大,复杂度较高。李工的方案则绕开了复杂的功能封装,只需要明确数据的位置与标识,通过特定的网络协议直接使用标识定位并获取数据,与王工的方案相比工作量小,实现简单。
    从数据交互方式看,王工的方案采用远程过程调用和异步XML消息等模式实现数据交互,这种方式适合于系统之间功能调用时进行的少量数据传输,而在进行单纯的数据访问时效率不高,稳定性也较差。李工的方案则以数据资源为核心,在对数据资源进行标识的基础上,通过标识符直接对数据资源进行访问与交互,实现简单且效率较高。
    从数据访问的上下文无关性看,王工的方案中数据访问是上下文有关的,具体表现在每次客户端进行数据请求都需要附加唯一的请求标识,并且服务端需要区分不同的客户端请求,效率较低。李工的方案中数据访问是上下文无关的,客户端通过全局唯一的统一资源标识符(URI)请求对应的数据资源,服务端不需要区分不同的客户端请求。
    【问题3】
    REST从资源的角度来定义整个网络系统结构,分布在各处的资源由统一资源标识符(URI)确定,客户端应用程序通过URI获取资源的表现,并通过获得资源表现使得其状态发生改变。
    REST中将资源、资源的表现和获取资源的动作三者进行分离。

  • 第14题:

    阅读以下关于 Web 系统架构设计的叙述,在答题纸上回答问题 1至问题 3。 【说明】 某公司开发的 B2C 商务平台因业务扩展,导致系统访问量不断增大,现有系统访问速度缓慢,有时甚至出现系统故障瘫痪等现象。面对这一情况,公司召开项目组讨论会议,寻求该商务平台的改进方案。讨论会上,王工提出可以利用镜像站点、CDN内容分发等方式解决并发访问量带来的问题。而李工认为,仅仅依靠上述外网加速技术不能完 全解决系统现有问题,如果访问量持续增加,系统仍存在崩渍的可能。李工提出应同时结合Web内网加速技术优化系统改进方案,如综合应用负载均衡、缓存服务器、Web应用服务器、分布式文件系统、分布式数据库等。经过讨论,公司最终决定采用李工的思路,完成改进系统的设计方案。

    【问题 1】 (10分) 针对李工提出的改进方案,从 a ~j 中分别选出各技术的相关描述和对应常见支持软件填入表 5-1 中的(1) ~(10) 处。保存静态文件,减少网络交换量,加速响应请求 可采用软件级和硬件级负载均衡实现分流和后台减压 文件存储系统,快速查找文件 FastDFS HAProxy JBoss Hadoop Distributed File System(HDFS) Apache Tomact Squid MongoDB 【问题 2】(9 分) 请用100字以内的文字解释分布式数据库的概念,并给出提高分布式数据库系统性能的 3 种常见实现技术。 【问题3】 (6 分) 针对 B2C 商务购物平台的数据浏览操作远远高于数据更新操作的特点,指出该系统应采用的分布式数据库实现方式,并分析原因。


    正确答案:问题1
    (1)(b)
    (2)(e)
    (3)(a)
    (4)(i)
    (5)(c)
    (6)(7)(d)(g)
    (8)(9)(f)(h)
    (10)(j)
    问题2
    分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个节点具有独立处理的能力(称为场地自治),它可以执行局部应用,同时,每个节点也能通过网络通信子系统执行全局应用。
     
    分布式数据库系统性能提升策略:
    1. 全局查询树的变换
    2. 副本的选择与多副本的更新策略
    3. 查询树的分解
    4. 半连接与直接连接

    问题3
    在本题所涉及到的环境中,由于读取数据的需求非常强烈,涉及到的数据量极大,而更新较少,可以在分布式数据库中采用一主多从的机制来分散读取数据的压力。更新数据时,操作主库,从主库再同步到从库,从库只负责读取数据。

  • 第15题:

    试题一(25 分)

    阅读以下关于企业应用集成的叙述,在答题纸上回答问题 1 至问题 3。

    某软件公司承担了某大型企业应用系统集成任务,该企业随着信息化的进展,积累了许多异构的遗产信息系统,这些系统分别采用 J2EE、.NET 等技术进行开发,分布在不同的地理位置,采用不同的协议进行数据传输。企业要求集成后的系统能够实现功能整合,并在组织现有功能的基础上提供增值服务。为了按时完成任务,选择合适的企业应用集成方法和架构非常重要。项目组在讨论方案时,提出了两种集成思路。

    (1)刘工建议采用传统的应用集成方法,将应用集成分为多个层次,并采用消息代理中间件连接遗产系统。 (2) 王工建议采用基于SOA的方法进行应用集成, 将现有遗产系统采用Web Service的方式进行包装,暴露统一格式的接口,并采用企业服务总线(ESB)进行连接。 项目组仔细分析比较了两种方案的优点和不足后,认为刘工和王工的建议都合理,但是结合当前项目的实际情况,最后决定采用王工的建议。

    【问题 1】 (8 分)

    请分析比较两种方案优点和不足,完成表 1-1 中的空白部分。

    【问题 2】 (8 分)

    针对该企业的集成实际情况,请用 200 字以内的文字叙述王工建议中企业服务总线(ESB)应该具有的基本功能。

    【问题 3】 (9 分)

    王工的方案拟采用 Web Service 作为基于 SOA集成方法的实现技术。 请根据该系统的实际情况,用 300 字以内的文字说明系统应该分为哪几个层次,并简要说明每个层次的功能和相关标准。


    正确答案:

  • 第16题:

    试题五(共25分)

    阅读以下有关软件与信息安全方面的说明,在答题纸上回答问题1至问题3。

    【说明】

    某软件公司拟开发一套信息安全支撑平台,为客户的局域网业务环境提供信息安全保护。该支撑平台的主要需求如下:

    (1)为局域网业务环境提供用户身份鉴别与资源访问授权功能;

    (2)为局域网环境中交换的网络数据提供加密保护;

    (3)为服务器和终端机存储的敏感持久数据提供加密保护;

    (4)保护的主要实体对象包括局域网内交换的网络数据包、文件服务器中的敏感数据文件、数据库服务器中的敏感关系数据和终端机用户存储的敏感数据文件:

    (5)服务器中存储的敏感数据按安全管理员配置的权限访问;

    (6)业务系统生成的单个敏感数据文件可能会达到数百兆的规模;

    (7)终端机用户存储的敏感数据为用户私有;

    (8)局域网业务环境的总用户数在100人以内。

    【问题l】(9分)

    在确定该支撑平台所采用的用户身份鉴别机制时,王工提出采用基于口令的简单认证机制,而李工则提出采用基于公钥体系的认证机制。项目组经过讨论,确定采用基于公钥体系的机制,请结合上述需求具体分析采用李工方案的原因。

    【问题2】(7分)

    针对需求(7),项目组经过讨论,确定了基于数字信封的加密方式,其加密后的文件结构如图5-1所示。请结合需求说明对文件数据进行加密时,应采用对称加密的块加密方式还是流加密方式,为什么?并对该机制中的数据加密与解密过程进行描述。

    <其他文件头信息>

    以数字信封形式封装的对称密钥

    用对称密钥加密的文件数据

    图5-1 加密数据文件结构

    【问题3】(9分)

    对数据库服务器中的敏感关系数据进行加密保护时,客户业务系统中的敏感关系数据主要是特定数据库表中的敏感字段值,客户要求对不同程度的敏感字段采用不同强度的密钥进行防护,且加密方式应尽可能减少安全管理与应用程序的负担。目前数据库管理系统提供的基本数据加密方式主要包括加解密API和透明加密两种,请用300字以内的文字对这两种方式进行解释,并结合需求说明应采用哪种加密方式。


    正确答案:

    试题分析

    本题考查的是安全性方面的知识,解决相关的问题,需要对一些基础知识有一定了解。如:对称加密与非对称加密的基本流程,优缺点;口令认证与基于公钥的数字证书认证做法有什么不同;数据库加密中的加解密API与透明加密。具体的情况参看试题答案。

    试题答案

    【问题l

    1)基于口令的认证方式实现简单,但由于口令复杂度及管理方面的原因,易受到认证攻击;而在基于公钥体系的认证方式中,由于其密钥机制的复杂性,同时在认证过程中私钥不在网络上传输,因此可以有效防止认证攻击,与基于口令的认证方式相比更为安全。

    2)按照需求描述,在完成用户身份鉴别后,需依据用户身份进一步对业务数据进行安全保护,且受保护数据中包含用户私有的终端机数据文件,在基于口令的认证方式中,用户口令为用户和认证服务器共享,没有用户独有的直接秘密信息,而在基于公钥的认证方式中,可基于用户私钥对私有数据进行加密保护,实现更加简便。

    3)基于公钥体系的认证方式协议和计算更加复杂,因此其计算复杂度要高于基于口令的认证方式,但业务环境的总用户数据在100人以内,用户规模不大,运行环境又为局域网环境,因此基于公钥体系的认证方式可以满足平台效率要求。

    【问题2

    应采用流加密方式。因为需求中提及单个敏感数据文件可能会达到数百兆的规模,文件数据量较大,使用流加密方式可以获得更高的加解密效率。

    数据加密与解密过程如下:

    其加密过程为:首先生成一个对称密钥,使用用户公钥加密这个对称密钥后存储在文件头,然后用生成的对称密钥加密文件数据存储。

    其解密过程为:用户首先使用自己的私钥解密被加密的对称密钥,再用该对称密钥解密出数据原文。

    【问题3

    目前数据库管理系统提供的基本数据加密支持主要有以下两种:

    1)加解密API:数据库管理系统提供可在SQL语句中调用的加解密API,应用可以利用这些API构建自己的基础架构,对数据进行加密保护。

    2)透明加密:安全管理员为数据库敏感字段选择加密方式及密钥强度,应用访问受保护数据时只需使用口令打开或关闭密钥表,对数据的加密和解密由数据库管理系统自动完成。

    加解密API方式的灵活性强,但构建和管理复杂;而透明加密方式管理简单,应用程序负担轻,但灵活性较差。用户要求尽可能减少安全管理与应用程序的负担,因此应选择透明加密方式。


  • 第17题:

    某企业欲对内部的数据库进行数据集成。如果集成系统的业务逻辑较为简单,仅使用数据库中的单表数据即可实现业务功能,这时采用()方式进行数据交换与处理较为合适;

    A. 数据网关
    B.主动记录
    C.包装器
    D.数据映射

    答案:B
    解析:
    考核数据集成。

  • 第18题:

    阅读以下关于 Web 系统架构设计的叙述,在答题纸上回答问题1 至问题 3。

    【说明】

    某公司开发的 B2C 商务平台因业务扩展,导致系统访问量不断增大,现有系统访问速度缓慢,有时甚至出现系统故障瘫痪等现象。面对这一情况,公司召开项目组讨论会议,寻求该商务平台的改进方案。讨论会上,王工提出可以利用镜像站点、CDN 内容分发等方式解决并发访问量带来的问题。而李工认为,仅仅依靠上述外网加速技术不能完全解决系统现有问题,如果访问量持续增加,系统仍存在崩渍的可能。李工提出应同时结合 Web 内网加速技术优化系统改进方案,如综合应用负载均衡、缓存服务器、Web 应用服务器、分布式文件系统、分布式数据库等。经过讨论,公司最终决定采用李工的思路,完成改进系统的设计方案。

    【问题 1】 (10 分)

    针对李工提出的改进方案,从 a ~j 中分别选出各技术的相关描

    述和对应常见支持软件填入表 5-1 中的(1) ~(10) 处。

    【问题 2】(9 分)

    请用 100 字以内的文字解释分布式数据库的概念,并给出提高分布式数据库系统性能的 3 种常见实现技术。

    【问题 3】 (6 分)

    针对 B2C 商务购物平台的数据浏览操作远远高于数据更新操作的特点,指出该系统应采用的分布式数据库实现方式,并分析原因。


    答案:
    解析:
    【问题 1】 (10 分)
    答案:(1)b;(2)e;(3)a;(4)i;(5)c;(6)d;(7)g;(8)f;(9)h;(10)j。
    【问题 2】(9 分)

    答案:分布式数据库是由一组数据组成的,这组数据分布在计算机网络的不同计算机上,网络中的每个节点具有独立处理的能力(称为场地自治),它可以执行局部应用,同时,每个节点也能通过网络通信子系统执行全局应用。

    (1)采用数据分片技术,提高访问的局部性,提升系统性能。

    (2)采用查询优化技术(包括:全局查询树的变换、副本的选择与多副本的更新策略、查询树的分解、半连接与直接连接)提高查询速度。

    (3)读写分离技术

    【问题 3】 (6 分)

    答案:在本题所涉及到的环境中,由于读取数据的需求非常强烈,涉及到的数据量极大,而更新较少,可以在分布式数据库中采用一主多从的机制来分散读取数据的压力。更新数据时,操作主库,从主库再同步到从库,从库只负责读取数据。

  • 第19题:

    请详细阅读有关数据库方面的描述,回答问题。

    【说明】某软件公司欲开发一个基于Web 2.0的大型社交网络系统。就该系统的数据架构而言,李工决定采用公司熟悉的数据架构,使用通用的商用关系型数据库,系统内部数据采用中央集中方式存储。该系统投入使用后,初期用户数量少,系统运行平稳。6个月后,用户数出现了爆炸式增长,系统暴露出诸多问题,集中表现在:1.用户执行读写操作时,响应时间均变得很慢;2.随着系统功能的扩充,原有数据格式发生变化,又出现新的数据格式,维护困难;3.数据容量很快超过系统原有的设计上限,数据库扩容困难;4.软件系统不断出现宕机,整个系统可用性较差。经过多次会议讨论,公司的邹月平邹工建议采用NoSQL数据库来替代关系数据库,以解决上述问题。但薛大龙薛工指出NoSQL数据库出现时间不长,在使用上可能存在风险。公司技术人员对NoSQL数据库产品进行了认真测试,最终决定采用NoSQL数据库来替代现有的数据库系统。【问题1】10分请比较关系数据库与 NoSQL 数据的特点,如表 4-1 所示,以此来说明该系统更适合采用 NoSQL 数据库。请完成表 4-1 中的(1) ~ (5) 处空白。表 4-1 关系数据库与 NoSQL 数据库特征比较

    【问题2】15分公司最终决定采用邹工的方案,同时配合分布式缓存技术减轻数据库服务器压力,目前有Memcache和Redis两种方案,请从数据类型、持久化和分布式存储三个方面比较两种技术的区别。


    答案:
    解析:
    【问题1】(1)弱一致性(2)结构化数据(3)高(强)事务性(4)强(5)有限数据【问题2】
    在数据类型方面:Memcache支持简单Key/Value类型,而Redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,hash等数据结构的存储。 在持久化方面:Memcache不支持数据持久化,Redis支持支持数据持久化。 在分布式存储方面:Memcache服务器需要通过hash一致化来支撑主从结构,而Redis支持多种方式,主从、sentinel、cluster等。

  • 第20题:

    阅读以下关于分布式数据库缓存设计的叙述,在答题纸,上回答问题1至问题3.[说明]某企业是为城市高端用户提供高品质蔬菜生鲜服务的初创企业,创业初期为快速开展业务,该企业采用轻量型的开发架构(脚本语言+关系型数据库)研制了一套业务系统。业务开展后受到用户普遍欢迎,用户数和业务数量迅速增长,原有的数据库服务器已不能满足高度并发的业务要求。为此,该企业成立了专门的研发团队来解决该问题。张工建议重新开发整个系统,采用新的服务器和数据架构,解决当前问题的同时为日后的扩展提供支持。但是,李工认为张工的方案开发周期过长,投入过大,当前应该在改动尽量小的前提下解决该问题。李工认为访问量很大的只是部分数据,建议采用缓存工具MemCache来减轻数据库服务器的压力,这样开发量小,开发周期短,比较适合初创公司,同时将来也可以通过集群进行扩展。然而,刘工又认为李工的方案中存在数据可靠性和一致性问题,在宕机时容易丢失交易数据,建议采用Redis来解决问题。 在经过充分讨论,该公司最终决定采用刘工的方案。
    [问题1](9分)在李工和刘工的方案中,均采用分布式数据库缓存技术来解决问题。请说明分布式数据库缓存的基本概念。表4- 1中对MemCache和Redis两种工具的优缺点进行了比较,请补充完善表4-1中的空(1) ~ (6) 。表4-1

    [问题2](8分)刘工认为李工的方案存在数据可靠性和一致性的问题,请说明原因。为避免数据可靠性和一致性的问题,刘工的方案采用Redis作为数据库缓存,请说明基本的Redis与原有关系数据库的数据同步方案。[问题3](8分)请给出Redis分布式存储的2种常见方案和Redis集群切片的几种常见方式。


    答案:
    解析:
    [问题1](1)Redis不仅仅支持简单的k/v类型的数据,同时还提供list,set,hash等数据结构的存储。(2)不支持(3)支持(4)不支持(5)支持(6)弱支持,只能保证事务中的每个操作连续执行
    [问题2]主从复制集群、数据分片(Sharding)集群
    [问题3]客户端分片、Twemproxy、Redis Cluster、Proxy + Redis Cluster

  • 第21题:

    共享数据库是一种重要的企业应用集成方式。以下关于共享数据库集成方式的叙述中,错误的是()

    • A、共享数据库集成方式通常将应用程序的数据存储在一个共享数据库中,通过制定统一的数据库模式来处理不同应用的集成需求
    • B、共享数据库为不同的应用程序提供了统一的数据存储与格式定义,能够解决不同应用程序中数据语义不一致的问题
    • C、多个应用程序可能通过共享数据库频繁地读取和修改相同的数据,这会使共享数据库成为一个性能瓶颈
    • D、共享数据库集成方式的一个重要限制来自外部的已封装应用,这些封装好的应用程序只能采用自己定义的数据库模式,调整和集成余地较小

    正确答案:B

  • 第22题:

    “大集中”征管系统中实现非实时访问、存储长期历史数据、采用非规范化数据结构、面向查询统计的集成视图是()。

    • A、OLTP生产库
    • B、ODS运作数据库
    • C、DW数据仓库
    • D、LDAP数据库

    正确答案:C

  • 第23题:

    CAD/CAM信息(数据)集成的实现方式有:基于专用数据格式文件集成(),基于数据库集成。


    正确答案:中性(标准)格式数据交换文件