参考答案和解析
正确
更多“数据的清洗一般放在数据抽取阶段,这样可以节约后续的计算量和降低存储成本。”相关问题
  • 第1题:

    ()的任务是过滤那些不符合要求的数据。

    A、数据抽取

    B、数据转换

    C、数据清洗

    D、数据加载


    参考答案:C

  • 第2题:

    数据仓库的要素包括数据仓库的存储、数据仓库的管理和维护及()。

    A.数据抽取

    B.OLAP

    C.ETL

    D.数据挖掘


    参考答案:C

  • 第3题:

    复制数据、子集数据和重组数据中的数据,相同的内容可以存放在两个或者更多的机器中,这样保持【 】是设计的重要问题。


    正确答案:多个副本的同步
    多个副本的同步 解析:复制数据、子集数据和重组数据中数据,相同的内容可以存放在两个或者更多的机器中,这样,保持多个副本的同步是设计的重要问题。相关知识点: 在各种数据中,相同内容可以存放在两个或多个机器中,这样,保持多个副本的同步是设计中的重要问题,即当一个副本中的某个数据值发生改变时,在其他副本中相应值是否能够同步改变。在多数情况下,两个远程数据副本之间没有必要保持同步直到“分钟”,副本可以在一小时或一天脱离同步,只有一份副本被更新,这些更新以成批的方式传送到另外的副本。

  • 第4题:

    在选择多媒体数据压缩算法时需要综合考虑(19)。

    A.数据质量和存储要求

    B.数据的用途和计算要求

    C.数据质量、数据量和计算的复杂度

    D.数据质量和计算要求


    正确答案:C

  • 第5题:

    在选择数据压缩算法时需要综合考虑(35)。

    A.数据质量和存储要求

    B.数据的用途和计算要求

    C.数据质量、数据量和计算的复杂度

    D.数据的质量和计算要求


    正确答案:C
    解析:通常在选择数据压缩算法时需要综合考虑数据质量、数据量和计算的复杂度。数据质量好是指恢复数据失真较小;数据量越小,代表压缩比越大,压缩算法越好;压缩算法对计算复杂度的要求是压缩算法简单,速度快。另外,选择压缩算法是还应考虑硬件实现的可能性。

  • 第6题:

    下面关于数据分布设计的说法错误的是______。

    A) 数据库备份数据用于故障恢复,使用频率低的情况,可以存储在磁带中

    B) 应用数据使用频繁,要求的响应时间短,必须放在磁带上

    C) 索引和日志则使用频繁,必须放在支持直接存取的磁盘存储介质上

    D) 日志文件备份数据用于故障恢复数据量很大,可以存储在磁带中

    A.

    B.

    C.

    D.


    正确答案:B
    解析:数据库备份数据、日志文件备份数据用于故障恢复,使用频率低,而且数据量很大的情况,可以存储在磁带中。而应用数据、索引和日志则使用频繁,要求的响应时间短,必须放在支持直接存取(Direct Access)的磁盘存储介质上。当系统采用RAID等多磁盘存储系统时,可以将基本表和建立在表上的索引分别放在不同的磁盘上。这样在访问基本表时,存放数据和存放索引的磁盘驱动器并行工作,可以得到较快的文件读写速度;类似地,日志文件与数据库对象(表、索引等)也可分别存放在不同磁盘上以改善系统I/O性能。

  • 第7题:

    冯·诺依曼计算机中指令和数据存放在存储器中,CPU区分它们的依据是( )。

    A.指令操作码的译码结果
    B.指令周期的不同阶段
    C.指令和数据的寻址方式
    D.指令和数据所在的存储单元

    答案:B
    解析:
    本题考查计算机系统结构相关的基础知识。1945年6月,冯·诺依曼提出了在数字计算机内部的存储器中存放程序的概念(Stored Program Concept),这是所有现代电子计算机的范式,被称为“冯·诺依曼结构”,按这一结构建造的电脑称为存储程序计算机(Stored?Program?Computer),又称为通用计算机。冯·诺依曼计算机主要由运算器、控制器、存储器和输入输出设备组成,它的主要特点有:(a)指令和数据以同等地位存放于存储内,并可按地址访问;(b)指令和数据均可用二进制表示;(c)指令由操作码和地址吗组成,操作码表示操作的性质,地址码表示操作数在存储器中的位置;(d)指令在存储器中按顺序存放。通常指令是顺序执行的。在特殊情况下,可根据运算结果或指定的条件来改变运算顺序;(e)机器以运算器为中心,输入输出设备和存储器之间的数据传送通过运算器完成。

  • 第8题:

    关于存储整合描述正确的是?()

    • A、存储整合可以降低IT系统的复杂度
    • B、存储整合可以简化操作,便于管理维护
    • C、存储整合将所有数据放在一个存储设备里,增加了数据安全风险
    • D、存储整合可以帮用户提高存储利用率,降低总体拥有成本

    正确答案:A,B

  • 第9题:

    下列对于SAN和NAS描述正确的是:()

    • A、SAN更多的是用在数据库这种场景,来存储这种结构化的数据。
    • B、现在NAS是面向非结构化数据的存储,比如很多部门员工用于关键办公文档共享和集中存储的共享文件服务器。
    • C、DAS,NAS和SAN都是外部存储,因此可以轻松实现存储资源共享。
    • D、NAS特点是把服务器的文件系统放在了存储器里,这样服务器需要透过网络就可以来共享数据。

    正确答案:A,B,D

  • 第10题:

    数据仓库的真正关键技术是数据的()。

    • A、数据的抽取
    • B、数据分析
    • C、存储和管理
    • D、数据的表现

    正确答案:C

  • 第11题:

    以下对压缩软件的描述,不正确的是()

    • A、通过数据压缩,便于文件的传输
    • B、计算机中的程序压缩都采用有损压缩方式进行压缩
    • C、数据压缩为文件的传输节省了时间
    • D、通过数据压缩,可以节约存储成本

    正确答案:B

  • 第12题:

    单选题
    以下对压缩软件的描述,不正确的是()
    A

    通过数据压缩,便于文件的传输

    B

    数据压缩为文件的传输节省了时间

    C

    通过数据压缩,可以节约存储成本

    D

    计算机中的程序压缩都采用有损压缩方式进行压缩


    正确答案: D
    解析: 暂无解析

  • 第13题:

    通过数据压缩手段把信息数据量压下来,可以节约存储空间,提高通讯干线的传输效率,使计算机能够实时处理音频、视频信息成为可能。()

    此题为判断题(对,错)。


    参考答案:正确

  • 第14题:

    在选择多媒体数据压缩算法时需要综合考虑______。

    A.数据质量和存储要求

    B.数据的用途和计算要求

    C.数据质量、数据量和计算的复杂度

    D.数据的质量和计算要求

    A.

    B.

    C.

    D.


    正确答案:C
    解析:通常,在选择数据压缩算法时除了需要考虑硬件实现的可能性之处,还需综合考虑数据质量、数据量和计算的复杂度。如果数据恢复失真较小则数据质量好。当数据量越小时,则代表压缩比越大,压缩算法越好。而压缩算法对计算复杂度的要求是压缩算法简单、速度快。

  • 第15题:

    数据库是长期存储在计算机内有组织的、可共享的数据集合。数据库是按其某种数据模型进行组织存放在外存储器上的,而且可以被多个用户同时使用。具有较小的冗余度,较高的数据独立性和【 】。


    正确答案:易扩展性
    易扩展性 解析:数据库具有的特点是具有较小的冗余度,较高的数据独立性和易扩展性。

  • 第16题:

    复制数据、子集数据和重组数据中数据,相同内容可以存放在两个或者更多的机器中,这样,保持【 】是设计中的重要问题。


    正确答案:多个副本的同步
    多个副本的同步 解析:在各种数据中,相同内容可以存放在两个或多个机器中,这样,保持多个副本的同步是设计中的重要问题,即当一个副本中的某个数据值发生改变时,在其他副本中相应值是否能够同步改变。

  • 第17题:

    数据库应用系统的设计应该具有数据设计和【 】功能,对数据进行收集、存储、加工、抽取和传播等。


    正确答案:数据处理
    数据处理 解析:数据库应用系统的设计应该具有对数据进行收集、存储、加工、存取和传播等功能,即包括数据设计和数据处理,其中数据设计是系统设计的基础和核心。

  • 第18题:

    在大数据的关键技术中,数据抽取工作ETL是( )过程主要使用的技术

    A:数据采集
    B:数据存储
    C:数据清洗
    D:数据分析

    答案:A
    解析:
    大数据从数据源经过分析挖掘到最终获得价值一般需要经过5个主要环节,包括数据采集、
    数据存储与管理、计算处理、数据分析和知识展现。在数据采集阶段主要使用的技术是数据抽取工具ETL。在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。

  • 第19题:

    计算机信息系统的特征之一是它涉及的数据量大,数据一般需存放在辅助存储器(即外存)中。


    正确答案:正确

  • 第20题:

    关于备份和容灾的理解以下哪项是正确的?()

    • A、数据备份需要将生产存储和备份存储放在同一机房
    • B、数据放在不同的地域就可以实现容灾
    • C、只要发生数据传输、数据存储和数据交换,就有可能产生数据故障,进而影响业务的使用,所以需要有数据备份保证数据的安全性
    • D、容灾或备份都可以保证数据不会丢失

    正确答案:A

  • 第21题:

    关于一体化电网运行智能系统对所需要的数据信息的管理的说法正确的有()。

    • A、数据检核主要针对数据本身、数据之间的关系及数据量是否符合预期标准进行检查与核对
    • B、数据安全隐患主要表现在信息被窃取和恶意的数据修改等方面,不包括数据的意外丢失或毁坏
    • C、数据ETL过程是根据不同的异构数据源,通过数据抽取、清洗转换和加载,形成统一目标数据的过程
    • D、数据存储着重于对整个组织持续的数据进行存储管理

    正确答案:A,C,D

  • 第22题:

    zookeeper节点的特性()

    • A、可以存储数据
    • B、不可以存储数据
    • C、可以计算数据
    • D、可以协调数据

    正确答案:A

  • 第23题:

    多选题
    关于存储整合描述正确的是?()
    A

    存储整合可以降低IT系统的复杂度

    B

    存储整合可以简化操作,便于管理维护

    C

    存储整合将所有数据放在一个存储设备里,增加了数据安全风险

    D

    存储整合可以帮用户提高存储利用率,降低总体拥有成本


    正确答案: A,B
    解析: 暂无解析

  • 第24题:

    单选题
    关于备份和容灾的理解以下哪项是正确的?()
    A

    数据备份需要将生产存储和备份存储放在同一机房

    B

    数据放在不同的地域就可以实现容灾

    C

    只要发生数据传输、数据存储和数据交换,就有可能产生数据故障,进而影响业务的使用,所以需要有数据备份保证数据的安全性

    D

    容灾或备份都可以保证数据不会丢失


    正确答案: A
    解析: 暂无解析