更多“关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。”相关问题
  • 第1题:

    数据挖掘是数据库知识发现过程的一个步骤,常用的数据挖掘方法有:关联规则挖掘、特征描述、分类分析和 ______。


    正确答案:聚类分析
    聚类分析 解析:数据挖掘是从大型数据库或数据仓库中发现并提取隐藏在内的信息的一种新技术,目的是寻找数据间潜在的关联,为预测趋势和决策行为提供有用的信息。常用的数据挖掘方法有:关联规则挖掘、特征描述、分类分析和聚类分析。

  • 第2题:

    数据挖掘是从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,主要任务有(24)。

    A.聚类分析、联机分析、信息检索等

    B.信息检索、聚类分析、分类分析等

    C.聚类分析、分类分析、关联规则挖掘等

    D.分类分析、联机分析、关联规则挖掘等


    正确答案:C
    数据挖掘(英语:Datamining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-DiscoveryinDatabases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析,等等。

  • 第3题:

    大型数据库中的关联规则挖掘包含两个过程()和()


    正确答案:找出所有频繁项集;由频繁项集产生强关联规则

  • 第4题:

    简述在多层关联规则挖掘中,在不同的层使用一致的支持度的优缺点。


    正确答案:优点:搜索是容易采用优化策略,即一个项如果不满足最小支持度,它的所有子项都可以不用搜索。缺点:最小支持度设置困难,太高则将丢掉出现在较低抽象层中有意义的关联规则;太低则会在较高层产生太多的无兴趣的规则。

  • 第5题:

    关联规则挖掘中,两个主要的兴趣度度量是:()和()


    正确答案:支持度;置信度

  • 第6题:

    从数据库中挖掘形如X、Y的规则,其中X为规则的前件,Y为规则的后件,这一过程称之为()。

    • A、关联规则发现
    • B、聚类分析
    • C、分类
    • D、序列模式发现

    正确答案:A

  • 第7题:

    关联规则发现是数据挖掘中最为重要和典型的一种方法。最常用的关联规则发现算法是().

    • A、Apriori算法
    • B、k-means算法
    • C、kNN算法
    • D、C4.5算法

    正确答案:A

  • 第8题:

    数据挖掘中的关联分析中,同时满足最小支持度和最小置信度的规则称为()。


    正确答案:强规则

  • 第9题:

    下列对关联规则的描述中,不正确的是()。

    • A、频繁项集的子集也一定是频繁的
    • B、若一个项集是非频繁的,则它的超集有可能是频繁的
    • C、Apriori算法是关联规则的经典技术
    • D、连接和剪枝是关联规则的两个常见步骤

    正确答案:B

  • 第10题:

    单选题
    从数据库中挖掘形如X、Y的规则,其中X为规则的前件,Y为规则的后件,这一过程称之为()。
    A

    关联规则发现

    B

    聚类分析

    C

    分类

    D

    序列模式发现


    正确答案: A
    解析: 暂无解析

  • 第11题:

    多选题
    数据挖掘通过()发现知识。
    A

    数据总结

    B

    数据分类

    C

    数据聚类

    D

    关联规则发现

    E

    企业文化建设


    正确答案: A,B,C,D
    解析: 暂无解析

  • 第12题:

    单选题
    数据挖掘中的关联分析中,同时满足()的规则称为强规则。
    A

    最大支持度和最大置信度

    B

    最大支持度和最小置信度

    C

    最小支持度和最大置信度

    D

    最小支持度和最小置信度


    正确答案: C
    解析: 暂无解析

  • 第13题:

    设有如下所示的某商场购物记录集合,每个购物篮中包含若干商品:

    购物篮编号

    商品

    1

    面包,牛奶

    2

    面包,啤酒,鸡蛋,尿布

    3

    牛奶,啤酒,尿布,可乐

    4

    面包,牛奶,啤酒,尿布

    5

    面包,牛奶,尿布,可乐

    现在要基于该数据集进行关联规则挖掘。如果设置最小支持度为60%,最小置信度为80%,则如下关联规则中,符合条件的是( )。

    A.啤酒→尿布

    B.(面包,尿布)→牛奶

    C.面包→牛奶

    D.(面包,啤酒)→尿布


    正确答案:A
    关联规则是形如X->Y的蕴涵表达式。关联规则的强度可以用它的支持度(s)和置信度(e)度量。支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含x的事务中出现的频繁程度。两者可以用公式表示:从题目中可以看到事务总数是5,A的{啤酒、尿布}支持度计数是3,{啤酒}支持计数是3,所以s=0.6。e=1。同理可得B{面包、尿布}支持计数为3,{面包、尿布、牛奶}支持计数是2,所以S=0.4,C=2/3。C中,{面包、牛奶}支持计数为3,{面包}支持计数为4,所以S=0.6,C=0.75。D中,{面包、啤酒}支持计数为2,{面包、啤酒、尿布}支持计数为2,所以S=0.4,e=1。综上所述,结果选A。

  • 第14题:

    在多维关联规则挖掘中,我们搜索的不是频繁项集,而是()


    正确答案:频繁谓词集

  • 第15题:

    关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。


    正确答案:错误

  • 第16题:

    关联规则的分类有哪些?关联规则挖掘的步骤包括什么?


    正确答案: 关联规则的分类:
    (1)基于规则中涉及到的数据的维数,关联规则可以分为单维的和多维的。
    (2)基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。
    (3)基于规则中处理的变量的类型不同,关联规则可以分为布尔型和数值型。
    关联规则挖掘的步骤:
    (1)找出交易数据库中所有大于或等于用户指定的最小支持度的频繁项集;
    (2)利用频繁项集生成所需要的关联规则,根据用户设定的最小可信度进行取舍,产生强关联规则。

  • 第17题:

    分别说明利用支持度、置信度和提升度评价关联规则的优缺点。


    正确答案:支持度
    优点:支持度高说明这条规则可能适用于数据集中的大部分事务。
    缺点:若支持度阈值过高,则许多潜在的有意义的模式由于包含支持度小的项而被删去;若支持度阈值过低,则计算代价很高而且产生大量的关联模式。
    置信度
    优点:置信度高说明如果满足了关联规则的前件,同时满足后件的可能性也非常大。
    缺点:找到负相关的关联规则。
    提升度:
    优点:提升度可以评估项集A的出现是否能够促进项集B的出现。
    缺点:会产生出现伪相互独立的规则。

  • 第18题:

    数据挖掘通过()发现知识。

    • A、数据总结
    • B、数据分类
    • C、数据聚类
    • D、关联规则发现
    • E、企业文化建设

    正确答案:A,B,C,D

  • 第19题:

    发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备;给定()和(),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则。

    • A、最大兴趣度,最小臵信度
    • B、最小臵信度,最大可信度
    • C、最小支持度,最小可信度
    • D、最大可信度,最大支持度

    正确答案:C

  • 第20题:

    数据挖掘中的关联分析中,同时满足()的规则称为强规则。

    • A、最大支持度和最大置信度
    • B、最大支持度和最小置信度
    • C、最小支持度和最大置信度
    • D、最小支持度和最小置信度

    正确答案:D

  • 第21题:

    以下说法正确的是()

    • A、关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
    • B、寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式
    • C、数据挖掘的主要任务是从数据中发现潜在的规律,从而能更好的完成描述数据、预测数据等任务。
    • D、在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。

    正确答案:C

  • 第22题:

    单选题
    下列对关联规则的描述中,不正确的是()。
    A

    频繁项集的子集也一定是频繁的

    B

    若一个项集是非频繁的,则它的超集有可能是频繁的

    C

    Apriori算法是关联规则的经典技术

    D

    连接和剪枝是关联规则的两个常见步骤


    正确答案: D
    解析: 暂无解析

  • 第23题:

    判断题
    关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第24题:

    填空题
    数据挖掘中的关联分析中,同时满足最小支持度和最小置信度的规则称为()。

    正确答案: 强规则
    解析: 暂无解析