8、以下关于K均值聚类的说法，错误的是：A．使用K均值聚类方法，需要一开始设置聚类个数B．K均值聚类适用于数据是连续型的场合C．我们只能利用侧影统计量辅助决定K均值聚类个数的选择D．变量个数越多，K均值聚类结果越好

题目

8、以下关于K均值聚类的说法，错误的是：

A．使用K均值聚类方法，需要一开始设置聚类个数

B．K均值聚类适用于数据是连续型的场合

C．我们只能利用侧影统计量辅助决定K均值聚类个数的选择

D．变量个数越多，K均值聚类结果越好

相似考题

1.K－means聚类是发现给定数据集的K个簇的算法。()此题为判断题(对，错)。

2.下列关于K均值聚类法的描述,正确的有()。A.类别数目的确定具有一定的主观性B.类别数目的确定具有一定的客观性C.基本思想是将每一个样本分配给最近重心(均值)的类中D.处理速度较快，效率高于系统聚类E.适合于大样本并且均为连续型变量的情形

3.K均值K－Means算法是密度聚类。()此题为判断题(对，错)。

4.影响基本K-均值算法的主要因素有()A.样本输入顺序B.模式相似性测度C.聚类准则

更多“8、以下关于K均值聚类的说法，错误的是：”相关问题

第1题：

聚类的典型应用不包括（），（请作答此空）是一个典型的聚类算法。

A.决策树
B.Apriori
C.k-means
D.SVM

答案：C
解析：
本题考査数据挖掘的基础知识。本题的选项中，A和D是典型的分类算法，B是频繁模式挖掘算法，而C是聚类算法。该题考核数据挖掘的基本概念，随着大数据时代的到来，数据挖掘是其中一个核心的技术，要求考对数据挖掘的基本功能以及基本的算法有一定的了解和掌握。
第2题：

简述k-means算法，层次聚类算法的优缺点。

正确答案:（1）k-means算法：
优点：算法描述容易，实现简单快速
不足：
簇的个数要预先给定
对初始值的依赖极大
不适合大量数据的处理
对噪声点和离群点很敏感
很难检测到“自然的”簇
（2）层次聚类算法：
BIRCH算法：
优点：利用聚类特征树概括了聚类的有用信息，节省内存空间；具有对象数目呈线性关系，可伸缩性和较好的聚类质量。
不足：每个节点只能包含有限数目的条目，工作效率受簇的形状的影响大。
C.URE算法：
优点：对孤立点的处理能力强；适用于大规模数据处理，伸缩性好，没有牺牲聚类质量。
缺点：算法在处理大量数据时必须基于抽样，划分等技术。
R.OCK算法：
优点：分类恰当，可采用随机抽样处理数据。
缺点：最坏的情况下时间复杂度级数大。
基于密度的聚类算法：可识别具有任意形状不同大小的簇，自动确定簇的数目，分离簇和环境噪声，一次扫描即可完成聚类，使用空间索引时间复杂度为O（NlbN）。
第3题：

K-Means聚类法要求自变量之间不存在共线性，是因为（）
- A、变量存在多重共线性时无法得到聚类结果
- B、变量存在多重共线性时无法解释聚类结果
- C、变量存在多重共线性时，相关变量会在距离计算中占据很高的权重，从而对聚类结果有负面的影响
- D、变量存在多重共线性时，得到的聚类结果是完全错误的
正确答案:C
第4题：

K均值是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。

正确答案:错误
第5题：

（）都属于分裂的层次聚类算法。
- A、二分K均值
- B、MST
- C、Chameleon
- D、组平均
正确答案:A,B
第6题：

下列关于黑洞力学定律说法错误的是：（）。
- A、第零定律是稳态黑洞的表面上，K是常数
- B、第一定律ΔM=（K/8Π）ΔA+ΩΔJ+VΔQ
- C、第二定律ΔA>0
- D、第三定律不能通过有限次操作，是K降到零
正确答案:C
第7题：

问答题
快速聚类法（K—均值法）的基本思想是怎样的？

正确答案：如果待分类样品比较多，应先给出一个大概的分类，然后不断对其进行修正，一直到分类结果比较合理为止。
解析：暂无解析
第8题：

多选题
以下哪些是监督分类的分类方法（）
A
K-均值算法
B
多级切割分类法
C
最大似然比法
D
动态聚类法

正确答案： B,D
解析：暂无解析
第9题：

单选题
以下哪个聚类算法不是属于基于原型的聚类（）。
A
模糊c均值
B
EM算法
C
SOM
D
CLIQUE

正确答案： C
解析：暂无解析
第10题：

多选题
（）都属于分裂的层次聚类算法。
A
二分K均值
B
MST
C
Chameleon
D
组平均

正确答案： D,B
解析：暂无解析
第11题：

多选题
以下属于聚类算法的是（）
A
K均值
B
DBSCAN
C
Apriori
D
Jarvis-Patrick（JP）

正确答案： D,C
解析：暂无解析
第12题：

判断题
K均值是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。
A
对
B
错

正确答案：错
解析：暂无解析
第13题：

下列关于CASS7.0软件所对应的简码说法中，错误的是（）。
- A、F表示房屋类地物
- B、K表示控制点
- C、X表示线类地物
- D、G管线类地物
正确答案:B
第14题：

关于K均值和DBSCAN的比较，以下说法不正确的是（）。
- A、K均值丢弃被它识别为噪声的对象，而DBSCAN一般聚类所有对象
- B、K均值使用簇的基于原型的概念，而DBSCAN使用基于密度的概念
- C、K均值很难处理非球形的簇和不同大小的簇，DBSCAN可以处理不同大小和不同形状的簇
- D、K均值可以发现不是明显分离的簇，即便簇有重叠也可以发现，但是DBSCAN会合并有重叠的簇
正确答案:A
第15题：

以下哪个聚类分析的方法是利用统计学定义的距离进行度量（）
- A、层次聚类法
- B、快速聚类法（K-Mans）
- C、基于密度的聚类法
- D、基于网格的聚类法
正确答案:A,B
第16题：

关于混合模型聚类算法的优缺点，下面说法正确的是（）
- A、当簇只包含少量数据点，或者数据点近似协线性时，混合模型也能很好地处理
- B、混合模型比K均值或模糊C均值更一般，因为它可以使用各种类型的分布
- C、混合模型很难发现不同大小和椭球形状的簇
- D、混合模型在有噪声和离群点时不会存在问题
正确答案:B
第17题：

以下属于聚类算法的是（）
- A、K均值
- B、DBSCAN
- C、Apriori
- D、Jarvis-Patrick（JP）
正确答案:A,B,D
第18题：

以下哪些是监督分类的分类方法（）
- A、K-均值算法
- B、多级切割分类法
- C、最大似然比法
- D、动态聚类法
正确答案:B,C
第19题：

单选题
关于传热系数K下述说法中错误的是（）
A
传热过程中总传热系数K实际是个平均值；
B
总传热系数K随着所取的传热面不同而异；
C
总传热系数K可用来表示传热过程的强弱，与冷、热流体的物性无关；
D
要提高K值，应从降低最大热阻着手

正确答案： C
解析：暂无解析
第20题：

单选题
关于K均值和DBSCAN的比较，以下说法不正确的是（）
A
K均值丢弃被它识别为噪声的对象，而DBSCAN一般聚类所有对象
B
K均值使用簇的基于原型的概念，而DBSCAN使用基于密度的概念
C
K均值很难处理非球形的簇和不同大小的簇，DBSCAN可以处理不同大小和不同形状的簇
D
K均值可以发现不是明显分离的簇，即便簇有重叠也可以发现，但是DBSCAN会合并有重叠的簇

正确答案： D
解析：暂无解析
第21题：

问答题
简述系统聚类与K-means聚类的基本原理。

正确答案： K.means聚类的基本原理：
聚类不一定事先确定有多少类；但是K-means聚类却要求先说好要分多少类。看起来有些主观。
假定分3类，这个方法还进一步要求你事先确定3个点为“聚类种子”（多数软件会自动选种子）；也就是说，把这3个点作为三类中每一类的基石。然后根据和这三个点的距离远近，把所有点分成三类。再把这三类的中心（均值）作为新的基石或种子（原来“种子”就没用了），再重新按照距离分类。如此叠代下去，直到达到停止叠代的要求（比如，各类最后变化不大了，或者叠代次数太多了）。显然，前面的聚类种子的选择并不必太认真，它们很可能最后还会分到同一类中。
解析：暂无解析
第22题：

问答题
试述K均值法与系统聚类法的异同。

正确答案：相同：K—均值法和系统聚类法一样，都是以距离的远近亲疏为标准进行聚类的。
不同：系统聚类对不同的类数产生一系列的聚类结果，而K—均值法只能产生指定类数的聚类结果。
具体类数的确定，离不开实践经验的积累；有时也可以借助系统聚类法以一部分样品为对象进行聚类，其结果作为K—均值法确定类数的参考。
解析：暂无解析
第23题：

多选题
以下哪个聚类分析的方法是利用统计学定义的距离进行度量（）
A
层次聚类法
B
快速聚类法（K-Mans）
C
基于密度的聚类法
D
基于网格的聚类法

正确答案： C,A
解析：暂无解析
第24题：

单选题
关于混合模型聚类算法的优缺点，下面说法正确的是（）
A
当簇只包含少量数据点，或者数据点近似协线性时，混合模型也能很好地处理
B
混合模型比K均值或模糊C均值更一般，因为它可以使用各种类型的分布
C
混合模型很难发现不同大小和椭球形状的簇
D
混合模型在有噪声和离群点时不会存在问题

正确答案： C
解析：暂无解析

题目

相似考题

更多“8、以下关于K均值聚类的说法，错误的是：”相关问题

相关内容