更多“数据清洗的对象主要包括不完整的数据、错误的数据、重复的数据三大类。() ”相关问题
  • 第1题:

    数据清洗工作不包括(10) 。

    A.删除多余重复的数据

    B.纠正或删除错误的数据

    C.采用适当方法补充缺失的数据

    D.更改过大的和过小的异常数据


    正确答案:D
    本题考查信息处理基本概念。刚收集得到的原始数据很可能有一部分是“脏”的,需要清洗才能使用。例如,有些是重复的数据,有些是含有矛盾的数据回答的多个问题中发现有矛盾),有些是填写错误的数据(包括格式错误、数字错误)。对以上不同的情况要做不同的处理,这属于数据清洗工作。对过大的或者过小的异常数据要慎重处理,有可能是错误数据,但也有可能是正确的非常重要的超常数据。分析必理异常数据需要专业水平,不属于数据清洗工作。

  • 第2题:

    数据处理阶段,处理的对象包括

    A.残缺数据

    B.错误数据

    C.重复数据

    D.外部数据


    ABC

  • 第3题:

    数据清洗的主要作用是

    A.纠正错误

    B.删除重复项

    C.补充空值

    D.丢弃某些数据与变量


    A、B、C、D

  • 第4题:

    13、需要清洗的数据的主要类型包括:

    A.残缺数据

    B.干净数据

    C.错误数据

    D.重复数据


    ACD

  • 第5题:

    15、数据转换利用数理统计、数据挖掘或预定义的规则,从数据中检测和消除错误数据、不完整数据和重复数据,从而提高数据的质量。


    利用某种数据转换,使得转换后的数据具有方差同质性,而非正态性的缺陷也同时得到改善。(平方根转换,对数转换,反正弦转换,倒数转换) 原则:哪种方法能是处理平均数与其均方的相关性最小或各处理内均方间的变异降至最小,哪种方法就是最合适的转移方法。