更多“层次聚类方法包括哪些?”相关问题
  • 第1题:

    简述k-means算法,层次聚类算法的优缺点。


    正确答案:(1)k-means算法:
    优点:算法描述容易,实现简单快速
    不足:
    簇的个数要预先给定
    对初始值的依赖极大
    不适合大量数据的处理
    对噪声点和离群点很敏感
    很难检测到“自然的”簇
    (2)层次聚类算法:
    BIRCH算法:
    优点:利用聚类特征树概括了聚类的有用信息,节省内存空间;具有对象数目呈线性关系,可伸缩性和较好的聚类质量。
    不足:每个节点只能包含有限数目的条目,工作效率受簇的形状的影响大。
    C.URE算法:
    优点:对孤立点的处理能力强;适用于大规模数据处理,伸缩性好,没有牺牲聚类质量。
    缺点:算法在处理大量数据时必须基于抽样,划分等技术。
    R.OCK算法:
    优点:分类恰当,可采用随机抽样处理数据。
    缺点:最坏的情况下时间复杂度级数大。
    基于密度的聚类算法:可识别具有任意形状不同大小的簇,自动确定簇的数目,分离簇和环境噪声,一次扫描即可完成聚类,使用空间索引时间复杂度为O(NlbN)。

  • 第2题:

    划分聚类方法对数据集进行聚类时包含什么要点?


    正确答案:选种某种距离作为数据样本减的相似性度量、选择评价聚类性能的准则函数和选择某个初始分类,之后用迭代的方法得到聚类结果,使得评价聚类的准则函数取得最优值。

  • 第3题:

    聚类集团包含哪些客户()?

    • A、田园聚类客户
    • B、校园聚类客户
    • C、老乡聚类客户
    • D、产业聚类客户

    正确答案:A,B,C,D

  • 第4题:

    常用的聚类方法有样品聚类法、系统聚类法和()

    • A、图论聚类法
    • B、动态聚类法
    • C、回归聚类分析
    • D、平共处模糊聚类法

    正确答案:D

  • 第5题:

    典型聚类方法有哪些?


    正确答案:1)划分方法(每个划分表示一个聚类)
    2)层次方法(将数据对象组成一个聚类树)
    3)基于密度的方法(绝大多数划分方法都是基于对象之间的距离大小进行聚类)
    4)基于模型的方法(试图将给定数据与某个数学模型搭成最佳拟合)
    5)基于图的聚类算法(利用图的许多重要性质和特性)

  • 第6题:

    以下哪个聚类分析的方法是利用统计学定义的距离进行度量()

    • A、层次聚类法
    • B、快速聚类法(K-Mans)
    • C、基于密度的聚类法
    • D、基于网格的聚类法

    正确答案:A,B

  • 第7题:

    聚类分析也有不同的分类:按聚类方法可分为系统聚类和()。

    • A、指标聚类
    • B、系统聚类
    • C、动态聚类
    • D、产品聚类

    正确答案:C

  • 第8题:

    多选题
    层次聚类的聚类方式有()
    A

    凝聚方式聚类

    B

    分解方式聚类

    C

    Q型聚类

    D

    R型聚类


    正确答案: A,B
    解析: 暂无解析

  • 第9题:

    问答题
    在聚类分析中,常用的聚类要素的数据处理方法有哪些?

    正确答案: 总和标准化,标准差标准化,极大值标准化,极差的标准化。
    解析: 暂无解析

  • 第10题:

    单选题
    层次分析判断法属于()。
    A

    定性方法

    B

    定量方法

    C

    定性定量结合方法

    D

    聚类方法


    正确答案: A
    解析: 暂无解析

  • 第11题:

    多选题
    以下哪个聚类分析的方法是利用统计学定义的距离进行度量()
    A

    层次聚类法

    B

    快速聚类法(K-Mans)

    C

    基于密度的聚类法

    D

    基于网格的聚类法


    正确答案: C,A
    解析: 暂无解析

  • 第12题:

    问答题
    系统(谱系)聚类法包含哪些具体方法?

    正确答案: 先将待聚类的n个样品(或变量)各自看成一类,共有n类,然后按照事先选定的聚类方法计算每两类之间的聚类统计量,即某种距离(或者相似系数),将关系最密切的两类并为一类,其余不变,即的n-1类,再按照前面的计算方法计算新类与其他类之间的距离(或者相似系数),再将关系最密切的两类归为一类,其余不变,即得n-2类,继续下去,每次重复都减少一类,直到所有样品(或者变量)都归于一类。
    解析: 暂无解析

  • 第13题:

    从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。


    正确答案:错误

  • 第14题:

    在数据挖掘中,常用的聚类算法包括:()、()、()、基于网格的方法和基于模型的方法。


    正确答案:划分方法;层次方法;基于密度的方法

  • 第15题:

    层次分析判断法属于()。

    • A、定性方法
    • B、定量方法
    • C、定性定量结合方法
    • D、聚类方法

    正确答案:A

  • 第16题:

    以下哪种聚类方法可以发现任意形状的聚类?()

    • A、划分的方法
    • B、基于模型的方法
    • C、基于密度的方法
    • D、层次的方法

    正确答案:C

  • 第17题:

    什么是聚类?简单描述如下的聚类方法:划分方法,层次方法,基于密度的方法,基于模型的方法。为每类方法给出例子。


    正确答案:聚类是将数据划分为相似对象组的过程,使得同一组中对象相似度最大而不同组中对象相似度最小。主要有以下几种类型方法:
    (1)划分方法
    给定一个有N个元组或者记录的数据集,分裂法将构造K个分组,每一个分组就代表一个聚类,K 使用这个基本思想的算法有:K-MEANS算法、K-MEDOIDS算法、CLARANS算法。
    (2)层次方法
    这种方法对给定的数据集进行层次似的分解,直到某种条件满足为止。具体又可分为“自底向上”和“自顶向下”两种方案。例如在“自底向上”方案中,初始时每一个数据记录都组成一个单独的组,在接下来的迭代中,它把那些相互邻近的组合并成一个组,直到所有的记录组成一个分组或者某个条件满足为止。
    代表算法有:BIRCH算法、CURE算法、CHAMELEON算法等。
    (3)基于密度的方法
    基于密度的方法与其它方法的一个根本*区别是:它不是基于各种各样的距离,而是基于密度的。这样就能克服基于距离的算法只能发现“类圆形”的聚类的缺点。这个方法的指导思想就是:只要一个区域中的点的密度大过某个阈值,就把它加到与之相近的聚类中去。
    代表算法有:DBSCAN算法、OPTICS算法、DENCLUE算法等。
    (4)基于模型的方法
    基于模型的方法给每一个聚类假定一个模型,然后去寻找能够很好的满足这个模型的数据。这样一个模型可能是数据点在空间中的密度分布函数或者其它。它的一个潜在假定就是:目标数据集是由一系列的概率分布所决定的。
    基于模型的方法主要有两类:统计学方法和神经网络方法(SOM)。

  • 第18题:

    层次聚类的聚类方式有()

    • A、凝聚方式聚类
    • B、分解方式聚类
    • C、Q型聚类
    • D、R型聚类

    正确答案:A,B

  • 第19题:

    简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。

    • A、层次聚类
    • B、划分聚类
    • C、非互斥聚类
    • D、模糊聚类

    正确答案:B

  • 第20题:

    问答题
    在聚类分析中,常用的聚类要素的数据处理方法有哪几种?有哪些主要的聚类方法?

    正确答案: 总和标准化、标准差标准化、极大值标准化、极差的标准化。
    直接聚类法、最短距离聚类法、最远距离聚类法。
    解析: 暂无解析

  • 第21题:

    单选题
    常用的聚类方法有样品聚类法、系统聚类法和()
    A

    图论聚类法

    B

    动态聚类法

    C

    回归聚类分析

    D

    平共处模糊聚类法


    正确答案: A
    解析: 暂无解析

  • 第22题:

    单选题
    简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()
    A

    层次聚类

    B

    划分聚类

    C

    非互斥聚类

    D

    模糊聚类


    正确答案: A
    解析: 暂无解析

  • 第23题:

    填空题
    ()聚类是最为常用的模式聚类方法。

    正确答案: K均值
    解析: 暂无解析