4、影响k-均值聚类算法效果的主要因素之一是初始类心的选取,相比较而言,哪一种方法选取的k 个样本作为初 始类心较好?
A.按输入顺序选前k个
B.随机挑选k个
C.选相距最远的k个
D.选分布密度最高处的k个
第1题:
如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主要因素有()
A.已知类别样本质量
B.分类准则
C.量纲
第2题:
此题为判断题(对,错)。
第3题:
第4题:
K-means算法的缺点不包括()
第5题:
K-means算法的叙述正确的是()
第6题:
开始将N个样品各自作为一类,将规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离,重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类,此种聚类方法是()
第7题:
()都属于分裂的层次聚类算法。
第8题:
以下哪些是监督分类的分类方法()
第9题:
第10题:
在K-means算法中K是事先给定的,这个K值的选定是非常难以估计的
在K-means算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化
对于一个类中的每个对象,在其给定半径的领域中包含的对象不能少于某一给定的最小数目
从K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的
第11题:
二分K均值
MST
Chameleon
组平均
第12题:
对
错
第13题:
A.类别数目的确定具有一定的主观性
B.类别数目的确定具有一定的客观性
C.基本思想是将每一个样本分配给最近重心(均值)的类中
D.处理速度较快,效率高于系统聚类
E.适合于大样本并且均为连续型变量的情形
第14题:
第15题:
简述k-means算法,层次聚类算法的优缺点。
第16题:
K-means算法叙述正确的是()
第17题:
以下是哪一个聚类算法的算法流程() ①构造k-最近邻图。 ②使用多层图划分算法划分图。 ③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。
第18题:
K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。
第19题:
以下属于聚类算法的是()
第20题:
ISODATA算法与K-均值算法有什么不同。
第21题:
第22题:
模糊c均值
EM算法
SOM
CLIQUE
第23题:
第24题: