8、以下关于K均值聚类的说法,错误的是:A.使用K均值聚类方法,需要一开始设置聚类个数B.K均值聚类适用于数据是连续型的场合C.我们只能利用侧影统计量辅助决定K均值聚类个数的选择D.变量个数越多,K均值聚类结果越好

题目

8、以下关于K均值聚类的说法,错误的是:

A.使用K均值聚类方法,需要一开始设置聚类个数

B.K均值聚类适用于数据是连续型的场合

C.我们只能利用侧影统计量辅助决定K均值聚类个数的选择

D.变量个数越多,K均值聚类结果越好


相似考题
更多“8、以下关于K均值聚类的说法,错误的是:”相关问题
  • 第1题:

    聚类的典型应用不包括( ),(请作答此空)是一个典型的聚类算法。

    A.决策树
    B.Apriori
    C.k-means
    D.SVM

    答案:C
    解析:
    本题考査数据挖掘的基础知识。本题的选项中,A和D是典型的分类算法,B是频繁模式挖掘算法,而C是聚类算法。该题考核数据挖掘的基本概念,随着大数据时代的到来,数据挖掘是其中一个核心的技术,要求考对数据挖掘的基本功能以及基本的算法有一定的了解和掌握。

  • 第2题:

    简述k-means算法,层次聚类算法的优缺点。


    正确答案:(1)k-means算法:
    优点:算法描述容易,实现简单快速
    不足:
    簇的个数要预先给定
    对初始值的依赖极大
    不适合大量数据的处理
    对噪声点和离群点很敏感
    很难检测到“自然的”簇
    (2)层次聚类算法:
    BIRCH算法:
    优点:利用聚类特征树概括了聚类的有用信息,节省内存空间;具有对象数目呈线性关系,可伸缩性和较好的聚类质量。
    不足:每个节点只能包含有限数目的条目,工作效率受簇的形状的影响大。
    C.URE算法:
    优点:对孤立点的处理能力强;适用于大规模数据处理,伸缩性好,没有牺牲聚类质量。
    缺点:算法在处理大量数据时必须基于抽样,划分等技术。
    R.OCK算法:
    优点:分类恰当,可采用随机抽样处理数据。
    缺点:最坏的情况下时间复杂度级数大。
    基于密度的聚类算法:可识别具有任意形状不同大小的簇,自动确定簇的数目,分离簇和环境噪声,一次扫描即可完成聚类,使用空间索引时间复杂度为O(NlbN)。

  • 第3题:

    K-Means聚类法要求自变量之间不存在共线性,是因为()

    • A、变量存在多重共线性时无法得到聚类结果
    • B、变量存在多重共线性时无法解释聚类结果
    • C、变量存在多重共线性时,相关变量会在距离计算中占据很高的权重,从而对聚类结果有负面的影响
    • D、变量存在多重共线性时,得到的聚类结果是完全错误的

    正确答案:C

  • 第4题:

    K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。


    正确答案:错误

  • 第5题:

    ()都属于分裂的层次聚类算法。

    • A、二分K均值
    • B、MST
    • C、Chameleon
    • D、组平均

    正确答案:A,B

  • 第6题:

    下列关于黑洞力学定律说法错误的是:()。

    • A、第零定律是稳态黑洞的表面上,K是常数
    • B、第一定律ΔM=(K/8Π)ΔA+ΩΔJ+VΔQ
    • C、第二定律ΔA>0
    • D、第三定律不能通过有限次操作,是K降到零

    正确答案:C

  • 第7题:

    问答题
    快速聚类法(K—均值法)的基本思想是怎样的?

    正确答案: 如果待分类样品比较多,应先给出一个大概的分类,然后不断对其进行修正,一直到分类结果比较合理为止。
    解析: 暂无解析

  • 第8题:

    多选题
    以下哪些是监督分类的分类方法()
    A

    K-均值算法

    B

    多级切割分类法

    C

    最大似然比法

    D

    动态聚类法


    正确答案: B,D
    解析: 暂无解析

  • 第9题:

    单选题
    以下哪个聚类算法不是属于基于原型的聚类()。
    A

    模糊c均值

    B

    EM算法

    C

    SOM

    D

    CLIQUE


    正确答案: C
    解析: 暂无解析

  • 第10题:

    多选题
    ()都属于分裂的层次聚类算法。
    A

    二分K均值

    B

    MST

    C

    Chameleon

    D

    组平均


    正确答案: D,B
    解析: 暂无解析

  • 第11题:

    多选题
    以下属于聚类算法的是()
    A

    K均值

    B

    DBSCAN

    C

    Apriori

    D

    Jarvis-Patrick(JP)


    正确答案: D,C
    解析: 暂无解析

  • 第12题:

    判断题
    K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第13题:

    下列关于CASS7.0软件所对应的简码说法中,错误的是()。

    • A、F表示房屋类地物
    • B、K表示控制点
    • C、X表示线类地物
    • D、G管线类地物

    正确答案:B

  • 第14题:

    关于K均值和DBSCAN的比较,以下说法不正确的是()。

    • A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象
    • B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念
    • C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
    • D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇

    正确答案:A

  • 第15题:

    以下哪个聚类分析的方法是利用统计学定义的距离进行度量()

    • A、层次聚类法
    • B、快速聚类法(K-Mans)
    • C、基于密度的聚类法
    • D、基于网格的聚类法

    正确答案:A,B

  • 第16题:

    关于混合模型聚类算法的优缺点,下面说法正确的是()

    • A、当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理
    • B、混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布
    • C、混合模型很难发现不同大小和椭球形状的簇
    • D、混合模型在有噪声和离群点时不会存在问题

    正确答案:B

  • 第17题:

    以下属于聚类算法的是()

    • A、K均值
    • B、DBSCAN
    • C、Apriori
    • D、Jarvis-Patrick(JP)

    正确答案:A,B,D

  • 第18题:

    以下哪些是监督分类的分类方法()

    • A、K-均值算法
    • B、多级切割分类法
    • C、最大似然比法
    • D、动态聚类法

    正确答案:B,C

  • 第19题:

    单选题
    关于传热系数K下述说法中错误的是()
    A

    传热过程中总传热系数K实际是个平均值;

    B

    总传热系数K随着所取的传热面不同而异;

    C

    总传热系数K可用来表示传热过程的强弱,与冷、热流体的物性无关;

    D

    要提高K值,应从降低最大热阻着手


    正确答案: C
    解析: 暂无解析

  • 第20题:

    单选题
    关于K均值和DBSCAN的比较,以下说法不正确的是()
    A

    K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象

    B

    K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念

    C

    K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇

    D

    K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇


    正确答案: D
    解析: 暂无解析

  • 第21题:

    问答题
    简述系统聚类与K-means聚类的基本原理。

    正确答案: K.means聚类的基本原理:
    聚类不一定事先确定有多少类;但是K-means聚类却要求先说好要分多少类。看起来有些主观。
    假定分3类,这个方法还进一步要求你事先确定3个点为“聚类种子”(多数软件会自动选种子);也就是说,把这3个点作为三类中每一类的基石。然后根据和这三个点的距离远近,把所有点分成三类。再把这三类的中心(均值)作为新的基石或种子(原来“种子”就没用了),再重新按照距离分类。如此叠代下去,直到达到停止叠代的要求(比如,各类最后变化不大了,或者叠代次数太多了)。显然,前面的聚类种子的选择并不必太认真,它们很可能最后还会分到同一类中。
    解析: 暂无解析

  • 第22题:

    问答题
    试述K均值法与系统聚类法的异同。

    正确答案: 相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。
    不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。
    具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。
    解析: 暂无解析

  • 第23题:

    多选题
    以下哪个聚类分析的方法是利用统计学定义的距离进行度量()
    A

    层次聚类法

    B

    快速聚类法(K-Mans)

    C

    基于密度的聚类法

    D

    基于网格的聚类法


    正确答案: C,A
    解析: 暂无解析

  • 第24题:

    单选题
    关于混合模型聚类算法的优缺点,下面说法正确的是()
    A

    当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理

    B

    混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布

    C

    混合模型很难发现不同大小和椭球形状的簇

    D

    混合模型在有噪声和离群点时不会存在问题


    正确答案: C
    解析: 暂无解析