4、影响k-均值聚类算法效果的主要因素之一是初始类心的选取，相比较而言，哪一种方法选取的k 个样本作为初始类心较好？A．按输入顺序选前k个B．随机挑选k个C．选相距最远的k个D．选分布密度最高处的k个

题目

4、影响k-均值聚类算法效果的主要因素之一是初始类心的选取，相比较而言，哪一种方法选取的k 个样本作为初始类心较好？

A．按输入顺序选前k个

B．随机挑选k个

C．选相距最远的k个

D．选分布密度最高处的k个

相似考题

1.K－means聚类是发现给定数据集的K个簇的算法。()此题为判断题(对，错)。

2.以下不属于影响聚类算法结果的主要因素有()A.已知类别的样本质量B.分类准则C.特征选取D.模式相似性测度

3.影响基本K-均值算法的主要因素有()A.样本输入顺序B.模式相似性测度C.聚类准则

4.K－means聚类中K值选取的方法是()。A、密度分类法B、手肘法C、大腿法D、随机选取

更多“4、影响k-均值聚类算法效果的主要因素之一是初始类心的选取，相比较而言，哪一种方法选取的k 个样本作为初始类心较好？”相关问题

第1题：

如果以特征向量的相关系数作为模式相似性测度，则影响聚类算法结果的主要因素有()
A.已知类别样本质量
B.分类准则
C.量纲

正确答案：B
第2题：

K均值K－Means算法是密度聚类。()

此题为判断题(对，错)。

正确答案：错误
第3题：

聚类的典型应用不包括（），（请作答此空）是一个典型的聚类算法。

A.决策树
B.Apriori
C.k-means
D.SVM

答案：C
解析：
本题考査数据挖掘的基础知识。本题的选项中，A和D是典型的分类算法，B是频繁模式挖掘算法，而C是聚类算法。该题考核数据挖掘的基本概念，随着大数据时代的到来，数据挖掘是其中一个核心的技术，要求考对数据挖掘的基本功能以及基本的算法有一定的了解和掌握。
第4题：

K-means算法的缺点不包括（）
- A、K必须是事先给定的
- B、选择初始聚类中心
- C、对于“噪声”和孤立点数据是敏感的
- D、可伸缩、高效
正确答案:D
第5题：

K-means算法的叙述正确的是（）
- A、在K-means算法中K是事先给定的，这个K值的选定是非常难以估计的
- B、在K-means算法中，首先需要根据初始聚类中心来确定一个初始划分，然后对初始划分进行优化
- C、对于一个类中的每个对象，在其给定半径的领域中包含的对象不能少于某一给定的最小数目的新的聚类心，因此当数据量非常大时，算法的时间开销是非常大的
正确答案:A,B,D
第6题：

开始将N个样品各自作为一类，将规定样品之间的距离和类与类之间的距离，然后将距离最近的两类合并成一个新类，计算新类与其他类的距离，重复进行两个最近类的合并，每次减少一类，直至所有的样品合并为一类，此种聚类方法是（）
- A、K－means
- B、SOM聚类
- C、系统聚类
- D、有序聚类
正确答案:C
第7题：

（）都属于分裂的层次聚类算法。
- A、二分K均值
- B、MST
- C、Chameleon
- D、组平均
正确答案:A,B
第8题：

以下哪些是监督分类的分类方法（）
- A、K-均值算法
- B、多级切割分类法
- C、最大似然比法
- D、动态聚类法
正确答案:B,C
第9题：

问答题
写出K-均值聚类算法的计算步骤。

正确答案：首先根据最终分类的个数k随机地选取k个初始的聚类中心，不断地迭代，知道达到目标函数的最小值，即得到最终的聚类结果。即：
1、为中心向量{C₁，C₂，……，C_K}初始化K个种子；
2、分组：
1）将样本分配给距离其最近的中心向量；
2）由这些样本构造不相交的聚类；
3、确定中心：用各个聚类的中心向量作为新的中心；
4、重复分组和确定中心的步骤，直至算法收敛。
解析：暂无解析
第10题：

多选题
K-means算法叙述正确的是（）
A
在K-means算法中K是事先给定的，这个K值的选定是非常难以估计的
B
在K-means算法中，首先需要根据初始聚类中心来确定一个初始划分，然后对初始划分进行优化
C
对于一个类中的每个对象，在其给定半径的领域中包含的对象不能少于某一给定的最小数目
D
从K-means算法框架可以看出，该算法需要不断地进行样本分类调整，不断地计算调整后的新的聚类中心，因此当数据量非常大时，算法的时间开销是非常大的

正确答案： A,B,D
解析：暂无解析
第11题：

多选题
（）都属于分裂的层次聚类算法。
A
二分K均值
B
MST
C
Chameleon
D
组平均

正确答案： D,B
解析：暂无解析
第12题：

判断题
K均值是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。
A
对
B
错

正确答案：错
解析：暂无解析
第13题：

下列关于K均值聚类法的描述,正确的有()。

A.类别数目的确定具有一定的主观性
B.类别数目的确定具有一定的客观性
C.基本思想是将每一个样本分配给最近重心(均值)的类中
D.处理速度较快，效率高于系统聚类
E.适合于大样本并且均为连续型变量的情形

答案：AC
第14题：

层次聚类算法分为哪两种方法?简述这两个层次聚类算法。

正确答案：层次聚类算法是假设类别之间存在层次结构，将样本聚到层次化的类中。层次聚类又有聚合或自底向上聚类、分裂或自顶向下聚类两种方法。聚合聚类开始将每个样本各自分到一个类，之后将相距最近的两类合并，建立一个新的类，重复此操作直到满足终止条件，得到层次化的类别。分裂聚类开始将所有样本分到一个类，之后将已有类中相距最远的样本分到两个新的类，重复此操作直到满足停止条件，得到层次化的类别。
第15题：

简述k-means算法，层次聚类算法的优缺点。

正确答案:（1）k-means算法：
优点：算法描述容易，实现简单快速
不足：
簇的个数要预先给定
对初始值的依赖极大
不适合大量数据的处理
对噪声点和离群点很敏感
很难检测到“自然的”簇
（2）层次聚类算法：
BIRCH算法：
优点：利用聚类特征树概括了聚类的有用信息，节省内存空间；具有对象数目呈线性关系，可伸缩性和较好的聚类质量。
不足：每个节点只能包含有限数目的条目，工作效率受簇的形状的影响大。
C.URE算法：
优点：对孤立点的处理能力强；适用于大规模数据处理，伸缩性好，没有牺牲聚类质量。
缺点：算法在处理大量数据时必须基于抽样，划分等技术。
R.OCK算法：
优点：分类恰当，可采用随机抽样处理数据。
缺点：最坏的情况下时间复杂度级数大。
基于密度的聚类算法：可识别具有任意形状不同大小的簇，自动确定簇的数目，分离簇和环境噪声，一次扫描即可完成聚类，使用空间索引时间复杂度为O（NlbN）。
第16题：

K-means算法叙述正确的是（）
- A、在K-means算法中K是事先给定的，这个K值的选定是非常难以估计的
- B、在K-means算法中，首先需要根据初始聚类中心来确定一个初始划分，然后对初始划分进行优化
- C、对于一个类中的每个对象，在其给定半径的领域中包含的对象不能少于某一给定的最小数目
- D、从K-means算法框架可以看出，该算法需要不断地进行样本分类调整，不断地计算调整后的新的聚类中心，因此当数据量非常大时，算法的时间开销是非常大的
正确答案:A,B,D
第17题：

以下是哪一个聚类算法的算法流程（） ①构造k－最近邻图。 ②使用多层图划分算法划分图。 ③repeat：合并关于相对互连性和相对接近性而言，最好地保持簇的自相似性的簇。 ④until：不再有可以合并的簇。
- A、MST
- B、OPOSSUM
- C、Chameleon
- D、Jarvis－Patrick（JP）
正确答案:C
第18题：

K均值是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。

正确答案:错误
第19题：

以下属于聚类算法的是（）
- A、K均值
- B、DBSCAN
- C、Apriori
- D、Jarvis-Patrick（JP）
正确答案:A,B,D
第20题：

ISODATA算法与K-均值算法有什么不同。

正确答案: 第一，它不是每调整一个样本的类别就重新计算一次各类样本的均值，而是在把所有样本都调整完毕之后才重新计算，前者称为逐个样本修正法，后者称为成批样本修正法；第二，ISODATA算法不仅可以通过调整样本所属类别完成样本的聚类分析，而且可以自动地进行类别“合并”和“分裂”，从而得到类数比较合理的聚类结果。
第21题：

问答题
按照聚类的原理和方法划分有哪三类聚类算法？各种聚类算法的思想是什么？

正确答案：按照聚类的原理和方法来划分聚类算法，分为：
①层次聚类；②划分聚类；③基于密度的聚类。
各种聚类算法的思想如下：
①层次聚类：递归的对对象进行合并或者分裂，直到满足某一终止条件。根据二叉树生成的顺序，可以把层次聚类方法分为合并型层次聚类和分解型层次聚类；
②划分聚类：给定聚类数目k和目标函数F，划分聚类算法把D划分成k个类，是的目标函数在此划分下达到最优，划分算法把聚类问题转化成一个组合优化问题，从一个初始划分或者一个厨师聚点集合开始，利用迭代控制策略优化目标函数。
③基于密度的聚类：根据空间密度的差别，把具有相似密度的点作为聚类。通常只扫描一次数据库。
解析：暂无解析
第22题：

单选题
以下哪个聚类算法不是属于基于原型的聚类（）。
A
模糊c均值
B
EM算法
C
SOM
D
CLIQUE

正确答案： C
解析：暂无解析
第23题：

问答题
试述K均值法与系统聚类法的异同。

正确答案：相同：K—均值法和系统聚类法一样，都是以距离的远近亲疏为标准进行聚类的。
不同：系统聚类对不同的类数产生一系列的聚类结果，而K—均值法只能产生指定类数的聚类结果。
具体类数的确定，离不开实践经验的积累；有时也可以借助系统聚类法以一部分样品为对象进行聚类，其结果作为K—均值法确定类数的参考。
解析：暂无解析
第24题：

问答题
ISODATA算法与K-均值算法有什么不同。

正确答案：第一，它不是每调整一个样本的类别就重新计算一次各类样本的均值，而是在把所有样本都调整完毕之后才重新计算，前者称为逐个样本修正法，后者称为成批样本修正法；第二，ISODATA算法不仅可以通过调整样本所属类别完成样本的聚类分析，而且可以自动地进行类别“合并”和“分裂”，从而得到类数比较合理的聚类结果。
解析：暂无解析

4、影响k-均值聚类算法效果的主要因素之一是初始类心的选取，相比较而言，哪一种方法选取的k 个样本作为初 始类心较好？A．按输入顺序选前k个B．随机挑选k个C．选相距最远的k个D．选分布密度最高处的k个

题目

相似考题

更多“4、影响k-均值聚类算法效果的主要因素之一是初始类心的选取，相比较而言，哪一种方法选取的k 个样本作为初 始类心较好？”相关问题

相关内容

4、影响k-均值聚类算法效果的主要因素之一是初始类心的选取，相比较而言，哪一种方法选取的k 个样本作为初始类心较好？A．按输入顺序选前k个B．随机挑选k个C．选相距最远的k个D．选分布密度最高处的k个

更多“4、影响k-均值聚类算法效果的主要因素之一是初始类心的选取，相比较而言，哪一种方法选取的k 个样本作为初始类心较好？”相关问题