参考答案和解析
正确答案:①尽可能赋予属性名和属性值明确的含义;
②统一多数据源的属性值编码;
③去除无用的惟一属性或键值(如自动增长的id);
④去除重复属性(在某些分析中,年龄和出生日期可能就是重复的属性,但在某些时候它们可能又是同时需要的);
⑤去除可忽略字段(大部分为空值的属性一般是没有什么价值的,如果不去除可能造成错误的数据挖掘结果);
⑥合理选择关联字段(对于多个关联性较强的属性,重复无益,只需选择其中的部分用于数据挖掘即可,如价格、数据、金额);
⑦去掉数据中的噪音、填充空值、丢失值和处理不一致数据。
更多“简述数据清理的基本内容。”相关问题
  • 第1题:

    下列关于电子数据审计流程的描述中,正确的是:

    A:数据采集——数据清理——数据转换——创建中间表——数据分析
    B:数据采集——数据转换——数据清理——创建中间表——数据分析
    C:数据采集——创建中间表——数据清理——数据转换——数据分析
    D:数据采集——创建中间表——数据转换——数据清理——数据分析

    答案:A
    解析:

  • 第2题:

    简述数据仓库设计的三级模型的基本内容。


    正确答案: (1)概念模型设计是在较高的抽象层次上的设计,其主要内容包括:界定系统边界和确定主要的主题域。
    (2)逻辑模型设计的主要内容包括:分析主题域、确定粒度层次划分、确定数据分割策略、定义关系模式、定义记录系统。
    (3)物理数据模型设计的主要内容包括:确定数据存储结构、确定数据存放位置、确定存储分配以及确定索引策略等。

  • 第3题:

    及时清理积压坯料是原料存放管理的基本内容。


    正确答案:正确

  • 第4题:

    汽缸吊空清理后,对汽缸体的检查包括那两个基本内容?


    正确答案: (1)仔细检查汽缸是否有冲刷、损坏,特别是汽缸结合面;(2)宏观检查汽缸是否有裂纹,发现裂纹后应边清除边进行认真观察,直至将裂纹清除干净不留残余,然后再做必要的处理。

  • 第5题:

    简述土地统计数据库的结构和基本内容、功能。


    正确答案:结构:目前,一般系统的设计都采用较为流行的模块化自顶向下的设计思想,整个系统由一层层的菜单和最后实施完成功能的功能模块组成,各功能模块既相互独立,又相互联系,而数据成为联系各模块的纽带。
    内容:
    1、基本土地统计信息
    2、研究应用软件
    3、成果输出
    功能:
    1、资料存储
    2、资料更新
    3、资料检索查询
    4、统计分析
    5、成果输出

  • 第6题:

    什么是数据处理?数据处理的基本内容是什么?


    正确答案: 数据处理指把来自科学研究、生产实践和社会经济活动等领域中的原始数据,用一定的设备和手段,按一定的使用要求加工成另一种形式的数据。数据处理的基本内容包括:数据收集、收集转换、数据的筛选、分组和排序、数据的组织、数据的运算(包括算术运算和逻辑运算)、数据存储、数据检索和数据输出等。

  • 第7题:

    问答题
    简述土地统计数据库的结构和基本内容、功能。

    正确答案: 结构:目前,一般系统的设计都采用较为流行的模块化自顶向下的设计思想,整个系统由一层层的菜单和最后实施完成功能的功能模块组成,各功能模块既相互独立,又相互联系,而数据成为联系各模块的纽带。
    内容:
    1、基本土地统计信息
    2、研究应用软件
    3、成果输出
    功能:
    1、资料存储
    2、资料更新
    3、资料检索查询
    4、统计分析
    5、成果输出
    解析: 暂无解析

  • 第8题:

    多选题
    数据清理主要方法有()。
    A

    有效范围清理

    B

    逻辑一致性清理

    C

    数据质量抽查

    D

    数据复查


    正确答案: D,C
    解析: 暂无解析

  • 第9题:

    问答题
    汽缸吊空清理后,对缸体检查包括哪些基本内容?

    正确答案: 汽缸吊空清理后,对缸体检查包括:
    (a)宏观检查汽缸是否有冲刷、损坏、特别是汽缸结合面有否泄漏痕迹;
    (b)仔细检查汽缸是否有裂纹,发现裂纹后,应边清除边进行认真观察,直至将裂纹清除干净,不留残余,然后再做必要的处理。
    解析: 暂无解析

  • 第10题:

    简述技能分析的基本内容。


    答案:
    解析:
    (1)技能单元。技能单元是技能分析的基本元素,是最小的分析单元,是对特定工作的具体说明。技能单元的描述和职位描述相一致,比如“将螺帽紧扣在螺钉上”是对工作任务的描述,它的技能描述就是“具备使用扳手拧紧螺钉的能力”。对工作任务的描述是技能分析的第一步。(2)技能模块。它是指从事某项具体工作任务所需要的技术或者知识。技能模块的本质是对技能单元进行分组,比如“拧螺钉”是一种技能,它可以被划分到“维修机器”这一技能模块中。技能模块是技能薪酬设计的基础,是区别于岗位薪酬的显著特征。技能模块的形式决定了技能薪酬的不同类型,包括技能等级模块和技能组合模块两种。
    (3)技能种类。它反映了一个工作群所有活动或者一个过程中各步骤的有关技能模块的集合,本质上是对技能模块进行的分组。多种技能模块组成一个技能种类。
    在技能薪酬设计中,企业通常首先划分技能种类,在技能种类的基础上对该技能种类所有的工作任务进行详尽的描述,然后根据不同种类所要建立的技能结构形式设计不同的技能模块。

  • 第11题:

    数据清理


    正确答案: 在数据录入过程中,难免会出现差错,在计算机分析前,进行数据清理工作一般会用有效范围清理;逻辑一致性清理;数据抽查清理者三种办法。

  • 第12题:

    及时清理积压坯料是存放管理的基本内容。


    正确答案:正确

  • 第13题:

    汽缸吊空清理后,对缸体检查包括哪些基本内容?


    正确答案: 包括:(1)宏观检查汽缸是否有冲刷、损坏、特别是汽缸结合面有否泄漏痕迹;
    (2)仔细检查汽缸是否有裂纹,发现裂纹后,应边清除边进行认真观察,直至将裂纹清除干净,不留残余,然后再做必要的处理。

  • 第14题:

    简述数据处理的概念及基本内容。


    正确答案: 概念:指把来自科学研究、生产实践和社会经济活动等领域中的原始数据,用一定的设备和手段,按一定的使用要求,加工成另一种形式的数据的过程
    基本内容:
    (1)数据收集
    (2)数据转换
    (3)数据的筛选
    (4)数据的组织
    (5)数据的运算

  • 第15题:

    简述电子政务数据挖掘的特点和基本内容。


    正确答案: 特点:
    (1)数据处理量极大。
    (2)为用户服务。
    (3)尽可能发现知识。
    (4)新陈代谢。
    (5)重视专家。
    (6)避免数据的动态性。
    (7)减少冗余数据。
    基本内容:
    (1)知识的识别。
    (2)知识的获取。
    (3)知识的分类。
    (4)知识的储存。
    (5)知识的传递与共享。
    (6)知识的评价。

  • 第16题:

    单选题
    下列关于电子数据审计流程的描述中,顺序正确的是(  )。
    A

    数据采集——创建中间表——数据清理——数据转换——数据分析

    B

    数据采集——数据转换——数据清理——创建中间表——数据分析

    C

    数据采集——数据清理——数据转换——创建中间表——数据分析

    D

    数据采集——创建中间表——数据转换——数据清理——数据分析


    正确答案: A
    解析:

  • 第17题:

    问答题
    简述数据处理的概念及基本内容。

    正确答案: 概念:指把来自科学研究、生产实践和社会经济活动等领域中的原始数据,用一定的设备和手段,按一定的使用要求,加工成另一种形式的数据的过程
    基本内容:
    (1)数据收集
    (2)数据转换
    (3)数据的筛选
    (4)数据的组织
    (5)数据的运算
    解析: 暂无解析