更多“数据清洗工作不包括(10) 。A.删除多余重复的数据B.纠正或删除错误的数据C.采用适当方法补充缺失 ”相关问题
  • 第1题:

    处理缺失值的方法可分为()。

    A.不处理

    B.添加数据

    C.删除记录

    D.数据插补


    正确答案:ACD

  • 第2题:

    数据清洗的方法不包括()。

    A.重复数据记录处理

    B.缺失值处理

    C.噪声数据清除

    D.一致性检查


    正确答案:A

  • 第3题:

    VTL6900的重复数据删除属于()

    A.基于文件的前删除技术

    B.基于文件的后删除技术

    C.基于数据块的前删除技术

    D.基于数据块的后删除技术


    答案:C

  • 第4题:

    SQL中的DELETE语句可以用于______。

    A.删除数据表的结构

    B.删除数据表

    C.删除数据表的记录

    D.删除数据表的字段


    正确答案:C

  • 第5题:

    数据加工前一般需要做数据清洗。数据清洗工作不包括( )。

    A.删除不必要的、多余的、重复的数据

    B.处理缺失的数据字段,做出特殊标记

    C.检测有逻辑错误的数据,纠正或删除

    D.修改异常数据值,使其落入常识范围


    正确答案:D

  • 第6题:

    在数据处理过程中,删除多余的重复数据、补充缺失的数据、纠正或删除错误的数据,这些工作属于( )。

    A.数据清洗

    B.数据加工

    C.数据转换

    D.数据分析


    正确答案:A
    本题考查信息处理基础知识。刚收集到的数据一般还存在一些问题,还不能直接进入加工环节。例如,收到的问卷调查表中,有些数据互相矛盾,有些重要的数据缺失,有些数据是多余的。数据录入后又会产生一些错误。问题数据一般称为脏数据,需要先进行清洗才能进入加工环节。错误的数据要纠正或删除,多余的数据要删除,缺失的数据有多种补救方法(用平均值代替、用默认值代替、用特殊符号代替以便在缆计时排除等),需要按照实际情况选用。

  • 第7题:

    数据库管理系统中的数据操纵语言(DML),可对数据库数据实现哪些操作?( )

    A.建立、授权、修改、删除

    B.建立、排序、授权、删除

    C.建立、插入、授权、删除

    D.查询、插入、修改、删除


    正确答案:D

  • 第8题:

    各类数据在企业生产经营中起着至关重要的作用,近乎所有的经营活动都要依赖数据,它犹如企业经营者的眼睛一样,通过数据可反映出经营的问题。当我们获取数据后,为顺利分析数据,需要先对数据进行清洗。数据清洗工作-般不包括( )。

    A.纠正或删除错误的数据
    B.估计合理值修改异常数据
    C.将缺失的数据补充完整
    D.筛选清除多余重复的数据

    答案:B
    解析:
    在数据挖掘过程中,数据清洗主要根据探索性分析后得到的一些结论入手,然后主要对四类异常数据进行处理;分别是缺失值(missing value),异常值(离群点),去重处理(Duplicate Data)以及噪音数据的处理。修改异常数据不属于数据清洗的内容。

  • 第9题:

    关系规范化的插入操作异常是指()

    • A、不该删除的数据被删除
    • B、插入的数据重复存储
    • C、应该删除的数据未被删除
    • D、应该插入的数据未被插入

    正确答案:D

  • 第10题:

    如何正确认识重复数据删除技术?()

    • A、重复数据删除技术可以删除重复的数据,提高存储利用率,但是目前阶段也有很多缺陷
    • B、重复数据删除通过软件实现,占用CPU和内存资源,影响当前作业性能
    • C、重复数据删除后,数据分布分散,形成碎片,恢复时速度下降
    • D、重复数据删除如果要达到较好的效果,数据检索算法和硬件性能很重要

    正确答案:A,B,C,D

  • 第11题:

    单选题
    关系规范化的插入操作异常是指()
    A

    不该删除的数据被删除

    B

    插入的数据重复存储

    C

    应该删除的数据未被删除

    D

    应该插入的数据未被插入


    正确答案: C
    解析: 暂无解析

  • 第12题:

    多选题
    农信社征信系统数据删除包括()。
    A

    发现属于数据重复报送的数据信息

    B

    发现属于征信系统错误造成的错误信息

    C

    客户逾期还款报送的数据信息

    D

    其他原因造成确需删除的数据信息


    正确答案: A,B
    解析: 暂无解析

  • 第13题:

    数据清洗主要是删除原始数据集中的()。

    A.平滑噪声数据

    B.异常数据

    C.重复数据

    D.无关数据


    正确答案:ACD

  • 第14题:

    在CRC校验中,接收端检查到有一位错误数据后,纠正的方法是______。

    A.请求重新发送

    B.删除数据

    C.通过余数的值由接收端自行纠正

    D.以上均可以


    正确答案:D
    解析:首先看选项A。当错误发生时请求重传这是一种非常普遍的纠错方式,它适用于任何一种编码传输,又因为CRC码是一种纠错码(把接收到的CRC码与生成多项式相除,可以确定错误位置),所以选项C也正确,所以此题只能选D。选项B的“删除数据”有些让人不好理解,其实我们可以这样来看,一般的数据传输不是一个两个字节,而是一段连续的数据,如果有一个接收数据出错了,我们把它删除,系统会认为这个数据包在传输过程中已经丢失,这样系统会自动发出重传请求,从而达到纠错的目的。

  • 第15题:

    获取数据后,为顺利分析数据,需要先进行数据清洗。数据清洗工作一般不包括( )。

    A. 筛选清除多余重复的数据

    B. 将缺失的数据补充完整

    C. 估计合理值修改异常数据

    D. 纠正或删除错误的数据


    答案: C 数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。一般修改异常数据通常在数据处理阶段由计算机完成。

  • 第16题:

    关系数据库规范化中的删除操作异常是指( )。

    A.删除了不该删除的数据

    B.应该删除的数据没有删除

    C.无法删除应该删除的数据

    D.无法恢复删除的数据


    正确答案:A
    解析:存储异常问题有:更新异常、插入异常和删除异常。其中删除异常是指当删除一些元组时,表中不打算删除的信息也被删除。

  • 第17题:

    现在的大数据处理系统具有智能删除重复数据的功能,其作用不包括( ) 。

    A.减少备份量

    B.降低存储成本

    C.保护数据安全

    D.加快备份和恢复速度


    正确答案:C
    本题考查信息处理基础知识。对于动态的大数据处理系统,删除重复数据并不容易。靠人工来做更难做到。智能删除重复数据软件随之产生。删除重复数据当然有利于降低存储成本、加快备份和恢复速度、减少备份量。删除重复数据对保护数据安全作用不大。

  • 第18题:

    关系规范化中的插入异常是指______。

    A.应该删除的数据未被删除

    B.应该插入的数据未被插入

    C.不该删除的数据被删除

    D.不该插入的数据被插入


    正确答案:B

  • 第19题:

    数据转储是( )中采用的基本技术。

    A.数据恢复
    B.数据更新
    C.数据创建
    D.数据删除

    答案:A
    解析:
    数据转储是数据库恢复中采用的基本技术。所谓转储即DBA定期地将整个数据库复制到磁带或另一个磁盘上保存起来的过程。转储可以分为动态和静态两种形式,也可以分为海量转储和增量转储两种形式。

  • 第20题:

    由于关系模式设计不当所引起的删除异常指的是()。

    A.应该删除的数据不能删除
    B.未经授权的用户对数据进行了删除操作
    C.数据删除过程中发生了故障
    D.不该删除的数据被删除

    答案:A
    解析:
    由于关系模式设计不当所引起的删除异常指的是应该删除的数据不能删除。

  • 第21题:

    农信社征信系统数据删除包括()。

    • A、发现属于数据重复报送的数据信息
    • B、发现属于征信系统错误造成的错误信息
    • C、客户逾期还款报送的数据信息
    • D、其他原因造成确需删除的数据信息

    正确答案:A,B,D

  • 第22题:

    数据清洗的方法不包括()。

    • A、缺失值处理
    • B、噪声数据清除
    • C、一致性检查
    • D、重复数据记录处理

    正确答案:D

  • 第23题:

    单选题
    数据清洗的方法不包括()。
    A

    缺失值处理

    B

    噪声数据清除

    C

    一致性检查

    D

    重复数据记录处理


    正确答案: C
    解析: 暂无解析