更多“简述Apriori算法的思想,谈谈该算法的应用领域。”相关问题
  • 第1题:

    简述ID3算法的基本思想及其主算法和建树算法的基本步骤。


    正确答案: 首先找出最有判别力的因素,然后把数据分成多个子集,每个子集又选择最有判别力的因素进一步划分,一直进行到所有子集仅包含同一类型的数据为止。最后得到一棵决策树,可以用它来对新的样例进行分类。
    主算法包括如下几步:
    ①从训练集中随机选择一个既含正例又含反例的子集(称为窗口);
    ②用“建树算法”对当前窗口形成一棵决策树;
    ③对训练集(窗口除外)中例子用所得决策树进行类别判定,找出错判的例子;
    ④若存在错判的例子,把它们插入窗口,重复步骤②,否则结束。
    建树算法的具体步骤如下:
    ①对当前例子集合,计算各特征的互信息;
    ②选择互信息最大的特征Ak
    ③把在Ak处取值相同的例子归于同一子集,Ak取几个值就得几个子集;
    ④对既含正例又含反例的子集,递归调用建树算法;
    ⑤若子集仅含正例或反例,对应分枝标上P或N,返回调用处。

  • 第2题:

    Apriori算法可用于分类预算。


    正确答案:错误

  • 第3题:

    可用作数据挖掘分析中的关联规则算法有()。

    • A、决策树、对数回归、关联模式
    • B、K均值法、SOM神经网络
    • C、Apriori算法、FP-Tree算法
    • D、RBF神经网络、K均值法、决策树

    正确答案:C

  • 第4题:

    简述分支限界法及其算法思想。


    正确答案: 这是一种用于求解组合优化问题的排除非解的搜索算法。类似于回溯法,分枝定界法在搜索解空间时,也经常使用树形结构来组织解空间。然而与回溯法不同的是,回溯算法使用深度优先方法搜索树结构,而分枝定界一般用宽度优先或最小耗费方法来搜索这些树。因此,可以很容易比较回溯法与分枝定界法的异同。相对而言,分枝定界算法的解空间比回溯法大得多,因此当内存容量有限时,回溯法成功的可能性更大。
    算法思想:分枝限界(branch and bound)是另一种系统地搜索解空间的方法,它与回溯法的主要区别在于对E-节点的扩充方式。每个活节点有且仅有一次机会变成E-节点。当一个节点变为E-节点时,则生成从该节点移动一步即可到达的所有新节点。在生成的节点中,抛弃那些不可能导出(最优)可行解的节点,其余节点加入活节点表,然后从表中选择一个节点作为下一个E-节点。从活节点表中取出所选择的节点并进行扩充,直到找到解或活动表为空,扩充过程才结束。
    有两种常用的方法可用来选择下一个E-节点(虽然也可能存在其他的方法):
    1)先进先出(FIFO)即从活节点表中取出节点的顺序与加入节点的顺序相同,因此活
    节点表的性质与队列相同。
    2)(优先队列)最小耗费或最大收益法在这种模式中,每个节点都有一个对应的耗费或收益。如果查找一个具有最小耗费的解,则活节点表可用最小堆来建立,下一个E-节点就是具有最小耗费的活节点;如果希望搜索一个具有最大收益的解,则可用最大堆来构造活节点表,下一个E-节点是具有最大收益的活节点。

  • 第5题:

    ID3,C4.5,CART等分类算法均是在()的基础上改进得到。

    • A、Apriori算法
    • B、SVD算法
    • C、Hunt算法
    • D、EM算法

    正确答案:C

  • 第6题:

    Apriori算法是一种常见的()。

    • A、关联规则发现算法
    • B、聚类分析算法
    • C、分类算法
    • D、序列模式发现算法

    正确答案:A

  • 第7题:

    简述哈夫曼压缩算法的编码思想。


    正确答案: ⑴将信源符号按概率递减顺序排列;
    ⑵把两个最小的概率加起来,作为新符号的概率;
    ⑶重复步骤⑴与⑵,直到概率和等于1为止;
    ⑷完成上述步骤后,再沿路径返回进行编码。寻找从每一信源符号到概率为1处的路径,每层有两个分支,分别赋予0和1(对概率大的赋予编码0,概率小的赋予编码1,反之亦可,但同一过程中赋值的方法必须一致),从而得到每个符号的编码。

  • 第8题:

    下列算法中,属于关联规则算法的是()。

    • A、Apriori算法
    • B、K-means算法
    • C、C4.5算法
    • D、Page Rank算法

    正确答案:A

  • 第9题:

    单选题
    Apriori算法是一种常见的()。
    A

    关联规则发现算法

    B

    聚类分析算法

    C

    分类算法

    D

    序列模式发现算法


    正确答案: A
    解析: 暂无解析

  • 第10题:

    问答题
    实现Apriori算法,说明Apriori算法的主要系统开销在哪里?

    正确答案: 1.Apriori算法需要在每一次迭代的时候扫描一次数据库,一般的挖掘出的最大频繁项目集的长度为N时,需要扫描N次数据库,而在实际应用中经常需要挖掘很长的模式,多次扫描数据库带来巨大开销。
    2.Apriori算法在迭代过程中要在内存中产生、处理和保存候选频繁项集,这个数量有时候是非常巨大的,导致算法在广度和深度上的适应性很差。
    解析: 暂无解析

  • 第11题:

    问答题
    简述种子填充算法与栅格算法的基本思想。

    正确答案: 种子填充算法(内部点扩散法):由一个内部的种子法,向其四个方向的邻点扩散。判断新加入的点是否是否在多边形边界上。如果是,就不作为种子点,否则当作新的种子点,直到区域填满,无种子点为止。该算法比较复杂,而且可能造成阻塞而造成扩散不能完成。此外若多边形不完全闭合时,会扩散出去。栅格算法:栅格指的是一条与扫描线垂直的直线,栅格位置通常取多边形的顶点,并且把多边形分为左右两半。基本思想是对于每个扫描线与多边形的交点,将交点与栅格之间的像素用多边形的属性值填补。若交点位于栅格左边,则将交点右边,栅格左边的所有像素取补;若交点位于右边,则把栅格右边交点左边的像素取补。
    解析: 暂无解析

  • 第12题:

    问答题
    简述遗传算法的应用领域。

    正确答案: 遗传算法的应用领域:
    (1)函数优化;
    (2)组合优化;
    (3)生产调度问题;
    (4)自动控制;
    (5)机器人;
    (6)图像处理;
    (7)人工生命;
    (8)遗传编程;
    (9)机器学习。
    解析: 暂无解析

  • 第13题:

    Apriori算法的计算复杂度受()影响。

    • A、支持度阀值
    • B、项数(维度)
    • C、事务数
    • D、事务平均宽度

    正确答案:A,B,C,D

  • 第14题:

    用于求解繁琐项集的一个经典算法是Apriori算法()


    正确答案:正确

  • 第15题:

    下列有关Apriori算法的说法中不正确的是()

    • A、Apriori算法是关联分析中最常用的算法之一
    • B、应用Apriori算法时,需要先设定模型的最小支持度、最小置信度等阈值
    • C、应用Apriori算法时,输入的数据可以是连续型数据也可以是离散型数据
    • D、Apriori算法扫描数据库的次数依赖于最大频繁项集中项的数量

    正确答案:C

  • 第16题:

    主要的数据挖掘算法有()。

    • A、分割聚类法
    • B、ID3算法
    • C、Apriori算法
    • D、遗传算法

    正确答案:A,B,C

  • 第17题:

    关联规则发现是数据挖掘中最为重要和典型的一种方法。最常用的关联规则发现算法是().

    • A、Apriori算法
    • B、k-means算法
    • C、kNN算法
    • D、C4.5算法

    正确答案:A

  • 第18题:

    简述种子填充算法与栅格算法的基本思想。


    正确答案: 种子填充算法(内部点扩散法):由一个内部的种子法,向其四个方向的邻点扩散。判断新加入的点是否是否在多边形边界上。如果是,就不作为种子点,否则当作新的种子点,直到区域填满,无种子点为止。该算法比较复杂,而且可能造成阻塞而造成扩散不能完成。此外若多边形不完全闭合时,会扩散出去。栅格算法:栅格指的是一条与扫描线垂直的直线,栅格位置通常取多边形的顶点,并且把多边形分为左右两半。基本思想是对于每个扫描线与多边形的交点,将交点与栅格之间的像素用多边形的属性值填补。若交点位于栅格左边,则将交点右边,栅格左边的所有像素取补;若交点位于右边,则把栅格右边交点左边的像素取补。

  • 第19题:

    下列哪种算法属于分类算法的范畴().

    • A、Apriori算法
    • B、k-means算法
    • C、kNN算法
    • D、FP-Growth算法

    正确答案:C

  • 第20题:

    简述扫描SCAN算法的主要思想.


    正确答案: SCAN算法的主要思想是:先从具有I/O请求的最低磁道号上开始处I/O请求,然后按磁道号的次序处理I/O请求,直到到达最高磁道号;再按相反的次序,重复这一过程.

  • 第21题:

    判断题
    Apriori算法可用于分类预算。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第22题:

    单选题
    下列有关Apriori算法的说法中不正确的是()
    A

    Apriori算法是关联分析中最常用的算法之一

    B

    应用Apriori算法时,需要先设定模型的最小支持度、最小置信度等阈值

    C

    应用Apriori算法时,输入的数据可以是连续型数据也可以是离散型数据

    D

    Apriori算法扫描数据库的次数依赖于最大频繁项集中项的数量


    正确答案: B
    解析: 暂无解析

  • 第23题:

    判断题
    用于求解繁琐项集的一个经典算法是Apriori算法()
    A

    B


    正确答案:
    解析: 暂无解析