更多“数据仓库的数据ETL过程中,ETL软件的主要功能包括: ”相关问题
  • 第1题:

    Describe the different types of ETL metadata and provide examples of each.

    举例说明各种ETL过程中的元数据。


    正确答案:
    答:元数据是ETL项目组面对的一个非常重要的主题,对于整个数据仓库项目也是非常重要的一部分。对于元数据的分类和使用没有很确定的定义。
    通常来说,我们可以把元数据分为三类,分别为业务元数据(Business Metadata),技术元数据(Technical Metadata)和过程处理元数据(Process Execution Metadata)。
    业务元数据,是从业务的角度对数据的描述。通常是用来给报表工具和前端用户对数据进行分析和使用提供帮助。
    技术元数据,是从技术的角度对数据的描述。通常包括数据的一些属性,如数据类型、长度、或者数据概况分析后一些结果。
    过程处理元数据,是ETL处理过程中的一些统计数据,通常包括有多少条记录被加载,多少条记录被拒绝接受等数据

  • 第2题:

    商业智能系统的主要功能包括数据仓库、数据 ETL,数据统计输出、分析( )不属于数据 ETL 的服务内容。

    A、数据迁移

    B、数据同步

    C、数据挖掘

    D、数据交换


    参考答案:C

  • 第3题:

    简述数据仓库ETL软件的主要功能和对产生数据的目标要求。


    正确答案:ETL软件的主要功能:
    数据的抽取,数据的转换,数据的加载;
    对产生数据的目标要求:
    详细的、历史的、规范化的、可理解的、即时的、质量可控制的。

  • 第4题:

    以下关于ETL质量控制表述不正确的是哪一个()

    • A、ETL质量控制的目标是保证ETL程序完成并通过测试,数据装载进入数据仓库并通过数据验证与检查
    • B、以“检查单”的形式对跟踪检查过程中发现的问题进行分析,并提出解决方案建议
    • C、依据数据源状态报告、需求分析说明书、数据仓库逻辑模型机说明文档、数据仓库物理模型及说明文档对ETL过程中得关键点进行跟踪检查
    • D、ETL质量控制饿目标位保证模型的设计、加载策略、权限设计以及前端展现设计严格满足需求分析的要求;保证为最终用户提供共享多维信息的快速分析和即时数据库查询

    正确答案:D

  • 第5题:

    数据抽取、转换、装载(ETL)是建立数据仓库的重要步骤,需要花费开发数据仓库约()的工作量。

    • A、50%
    • B、60%
    • C、70%
    • D、80%

    正确答案:C

  • 第6题:

    以下关于ETL质量控制表述不正确的是哪一个()

    • A、ETL质量控制的目标是保证ETL程序完成并通过测试,数据装载进入数据仓库并通过数据验证与检查
    • B、以“检查单”的形式对跟踪检查过程中发现的问题进行分析,并提出解决方案建议
    • C、依据数据源状态报告、需求分析说明书、数据仓库逻辑模型及说明文档、数据仓库物理模型及说明文档对ETL过程中的关键点进行跟踪检查
    • D、ETL质量控制的目标为保证模型的设计、加载策略、权限设计以及前端展现设计严格满足需求分析的要求;保证为最终用户提供共享多维信息的快速分析和即时数据库查询

    正确答案:D

  • 第7题:

    数据仓库的数据ETL过程中,ETL软件的主要功能包括:

    • A、数据抽取
    • B、数据转换
    • C、数据加载
    • D、数据稽核

    正确答案:A,B,C

  • 第8题:

    以下有关ETL表述不正确的是哪一个()

    • A、ETL由三个子过程构成:数据抽取、数据转换和数据加载
    • B、ETL又可以扩展为可以分为4个步骤:数据抽取、数据清洗、数据转换盒数据加载,即ETCL
    • C、ETL设计涉及到错误恢复过程设计、归档转储过程设计、作业调度过程设计等内容
    • D、根据选用的数据仓库工具将数据从数据源抽取到数据库,然后根据业务规则转换和集成为数据仓库中需要的数据格式,最后将换转的结果装入数据仓库

    正确答案:D

  • 第9题:

    多选题
    数据仓库的数据ETL过程中,ETL软件的主要功能包括:
    A

    数据抽取

    B

    数据转换

    C

    数据加载

    D

    数据稽核


    正确答案: B,C
    解析: 暂无解析

  • 第10题:

    单选题
    数据抽取、转换、装载(ETL)是建立数据仓库的重要步骤,需要花费开发数据仓库约()的工作量。
    A

    50%

    B

    60%

    C

    70%

    D

    80%


    正确答案: D
    解析: 暂无解析

  • 第11题:

    单选题
    以下关于ETL质量控制表述不正确的是哪一个()
    A

    ETL质量控制的目标是保证ETL程序完成并通过测试,数据装载进入数据仓库并通过数据验证与检查

    B

    以“检查单”的形式对跟踪检查过程中发现的问题进行分析,并提出解决方案建议

    C

    依据数据源状态报告、需求分析说明书、数据仓库逻辑模型及说明文档、数据仓库物理模型及说明文档对ETL过程中的关键点进行跟踪检查

    D

    ETL质量控制的目标为保证模型的设计、加载策略、权限设计以及前端展现设计严格满足需求分析的要求;保证为最终用户提供共享多维信息的快速分析和即时数据库查询


    正确答案: B
    解析: 暂无解析

  • 第12题:

    填空题
    ETL工具包括:数据提取、数据转换、()和数据加载。

    正确答案: 数据清洗
    解析: 暂无解析

  • 第13题:

    Describe how to estimate the load time of a large ETL job.

    Real Time ETL

    简述如何评估大型ETL数据加载时间。


    正确答案:
    答:评估一个大型的ETL的数据加载时间是一件很复杂的事情。数据加载分为两类,一类是初次加载,另一类是增量加载。
    在数据仓库正式投入使用时,需要进行一次初次加载,而这次初次加载需要的时间一般较难预料。在数据仓库的日常使用和维护中,每天需要对数据仓库进行增量加载。增量加载的数据量要比初次加载小很多。
    下面以初次加载为例来谈谈如何评估大型ETL的数据加载时间。
    对初次加载的加载时间进行预估,需要将整个ETL过程分成抽取、转换和加载三部分,分别对这三部分进行评估。
    1.对抽取时间的评估。
    抽取通常占用的ETL的大部分时间,而且对这部分需要时间的评估也是非常困难的。为了对这部分时间进行评估,我们可以将查询时间分成两部分,一部分是查询响应时间,另一部分是数据返回时间。查询响应时间指从查询开始执行到结果开始返回这段时间。数据返回时间指第一条记录返回到最后一条记录返回的时间。
    另外,初次加载的数据量太大,我们可以考虑选择其中的一部分来评估整体的时间,实际处理中,可以选择事实表的一个分区。一般来说各个分区的数据量差不多,评估出一个分区的时间,乘上分区数可以作为整体的评估时间。
    2.对数据转换时间的评估
    数据转换工作通常在内存中完成,一般来说都有着非常快的速度,占总体时间的比重比较小。如果要评估这部分需要的时间的话,最简单的评估方法是先评估出抽取时间和加载时间,然后运行整个过程,用整体时间减去抽取时间和加载时间。
    3.对加载时间的评估
    很多原因都可能影响加载时间,其中最重要的两个分别是索引和日志。
    对加载时间的评估,也可以像评估抽取时间时一样,选择加载数据的一部分,如1/200进行加载,计算出时间后乘以200来作为整体加载时间。
    总之,大型ETL数据的加载时间的评估是很困难的,我们采用的方法主要是类比评估,即选择一部分数据减少整体时间进行评估。在进行评估时要注意到测试环境和生产环境的配置等的差别会引起评估结果的偏差。虽然这种对时间的评估一定会有误差,但是可以做为整体加载时间的一个参考。

  • 第14题:

    商业智能系统的主要功能包括数据仓库、数据ETL、数据统计输出、分析( )不属于数据ETL的服务内容。

    A.数据迁移
    B.数据同步
    C.数据挖掘
    D.数据交换

    答案:C
    解析:
    本题考查的是数据ETL服务。
    数据ETL服务包括:数据迁移、数据合并、数据同步、数据同步、数据交换、数据联邦、数据仓库。数据挖掘为干扰性,故此题正确选项为C。数据ETL服务必须掌握,易考查选择题。

  • 第15题:

    以下哪个不是评审逻辑模型设计阶段所提交的文档()

    • A、ETL程序和源代码
    • B、数据源状态报告
    • C、ETL数据质量控制策略及流程
    • D、ETL系统设计说明书

    正确答案:B

  • 第16题:

    什么是数据仓库的数据ETL过程?


    正确答案: 数据的ETL过程就是负责将操作型数据转换成调和数据的过程。数据调和是构建一个数据仓库中最难的和最具技术挑战性的部分。在为企业级数据仓库填充数据的过程中,数据调和可分为两个阶段:一是企业级数据仓库(EDW)首次创建时的原始加载;二是接下来的定期修改,以保持EDW的当前有效性和扩展性。
    整个过程由四个步骤组成:抽取、清洗、转换、加载和索引。事实上,这些步骤可以进行不同的组合,如,可以将数据抽取与清洗组合为一个过程,或者将清洗和转换组合在一起。

  • 第17题:

    以下哪个不是ETL过程中的关键点进行跟踪检查的文档()

    • A、数据源状态报告
    • B、需求分析说明书
    • C、ETL流程设计说明书
    • D、数据仓库物理模型及说明文档

    正确答案:C

  • 第18题:

    ETL工具包括:数据提取、数据转换、()和数据加载。


    正确答案:数据清洗

  • 第19题:

    ETL的设计与实施主要包括()。

    • A、数据源的确认
    • B、明确本系统的数据获取来源
    • C、ETL模块规划
    • D、源数据分析

    正确答案:A,B,D

  • 第20题:

    多选题
    ETL即()的过程,是构建数据仓库的重要环节。
    A

    数据抽取

    B

    转换

    C

    装载


    正确答案: C,A
    解析: 暂无解析

  • 第21题:

    单选题
    ETL是()Transform Load的缩写,描述一个过程,是构建数据仓库系统非常核心的过程
    A

    Export

    B

    Explain

    C

    Extract

    D

    Electric


    正确答案: C
    解析: 暂无解析

  • 第22题:

    单选题
    以下哪个不是ETL过程中的关键点进行跟踪检查的文档()
    A

    数据源状态报告

    B

    需求分析说明书

    C

    ETL流程设计说明书

    D

    数据仓库物理模型及说明文档


    正确答案: C
    解析: 暂无解析

  • 第23题:

    单选题
    以下关于ETL质量控制表述不正确的是哪一个()
    A

    ETL质量控制的目标是保证ETL程序完成并通过测试,数据装载进入数据仓库并通过数据验证与检查

    B

    以“检查单”的形式对跟踪检查过程中发现的问题进行分析,并提出解决方案建议

    C

    依据数据源状态报告、需求分析说明书、数据仓库逻辑模型机说明文档、数据仓库物理模型及说明文档对ETL过程中得关键点进行跟踪检查

    D

    ETL质量控制饿目标位保证模型的设计、加载策略、权限设计以及前端展现设计严格满足需求分析的要求;保证为最终用户提供共享多维信息的快速分析和即时数据库查询


    正确答案: C
    解析: 暂无解析