参考答案和解析
正确答案:错误
更多“从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。”相关问题
  • 第1题:

    层次聚类算法分为哪两种方法?简述这两个层次聚类算法。


    正确答案:层次聚类算法是假设类别之间存在层次结构,将样本聚到层次化的类中。层次聚类又有聚合或自底向上聚类、分裂或自顶向下聚类两种方法。聚合聚类开始将每个样本各自分到一个类,之后将相距最近的两类合并,建立一个新的类,重复此操作直到满足终止条件,得到层次化的类别。分裂聚类开始将所有样本分到一个类,之后将已有类中相距最远的样本分到两个新的类,重复此操作直到满足停止条件,得到层次化的类别。

  • 第2题:

    数据挖掘方法中的聚类分析也被称为无制导学习。一个好的聚类分析算法应该使得所得到的______。

    A.聚簇问的相似性很高,而不同的聚簇内的相似性很低

    B.聚簇内的相似性很低,而不同的聚簇间的相似性很高

    C.聚簇间的相似性很低,而不同的聚簇内的相似性很低

    D.聚簇内的相似性很高,而不同的聚簇间的相似性很低

    A.

    B.

    C.

    D.


    正确答案:D

  • 第3题:

    以下描述错误的是?( )

    ASVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimalmarginclassifier)

    B在聚类分析中,簇内的相似性越大,簇间的差别越大,聚类的效果越好

    C在决策树中,随着树中节点变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题

    D聚类分析可以看做是一种非监督的分类


    答案:AC

  • 第4题:

    关于聚类算法K-Means和DBSCAN的叙述中,不正确的是( )。

    A.K-Means和DBSCAN的聚类结果与输入参数有很大的关系
    B.K-Means基于距离的概念而DBSCAN基于密度的概念进行聚类分析
    C.K-Means很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇
    D.当簇的密度变化较大时,DBSCAN不能很好的处理,而K-Means则可以

    答案:D
    解析:
    本题考查数据挖掘的基础知识。K-Means和DBSCAN是两个经典的聚类算法,将相似的数据对象归类一组,不相似的数据对象分开。K-means算法基于对象之间的聚类进行聚类,需要输入聚类的个数。DBSCAN算法基于密度进行聚类,需要确定阈值,两者的聚类结果均与输入参数关系很大。DBSCAN可以处理不同大小和不同形状的簇,而K-means算法则不适合。若数据分布密度变化大,则这两种算法都不适用。

  • 第5题:

    在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。


    正确答案:错误

  • 第6题:

    开始将N个样品各自作为一类,将规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离,重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类,此种聚类方法是()

    • A、K-means
    • B、SOM聚类
    • C、系统聚类
    • D、有序聚类

    正确答案:C

  • 第7题:

    K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。


    正确答案:错误

  • 第8题:

    在Excel2003要创建一个簇状柱行图并将该图表作为对象插入在工作表中,应执行()。

    • A、视图→图表→选择“簇状柱行图”→下一步→完成数据区域输入→下一步→输入“图表选项”内容→下一步→选择“作为其中的对象插入”→确定
    • B、格式→图表→选择“簇状柱行图”→下一步→完成数据区域输入→下一步→输入“图表选项”内容→下一步→选择“作为其中的对象插入”→确定
    • C、插入→图表→选择“簇状柱行图”→下一步→完成数据区域输入→下一步→输入“图表选项”内容→下一步→选择“作为其中的对象插入”→确定
    • D、文件→图表→选择“簇状柱行图”→下一步→完成数据区域输入→下一步→输入“图表选项”内容→下一步→选择“作为其中的对象插入”→确定

    正确答案:C

  • 第9题:

    单选题
    ()将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层次聚类技术。
    A

    MIN(单链)

    B

    MAX(全链)

    C

    组平均

    D

    Ward方法


    正确答案: D
    解析: 暂无解析

  • 第10题:

    单选题
    关于K均值和DBSCAN的比较,以下说法不正确的是()
    A

    K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象

    B

    K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念

    C

    K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇

    D

    K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇


    正确答案: D
    解析: 暂无解析

  • 第11题:

    判断题
    在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第12题:

    填空题
    NTFS中一个文件的起始簇号和文件占用的簇数这两个重要信息,从该文件的()属性中可得到

    正确答案: 80
    解析: 暂无解析

  • 第13题:

    已知关系:STUDENT(sno,sname,grade),以下关于命令 “CREATE CLUSTER INDEX s_index ON student (grade)” 的描述中,正确的是( )。

    A.按成绩降序创建了一个聚簇索引

    B.按成绩升序创建了一个聚簇索引

    C.π按成绩降序创建了一个非聚簇索引

    D.按成绩升序创建了一个非聚簇索引


    正确答案:B

  • 第14题:

    索引从物理上分为聚簇索引和【 】。


    正确答案:非聚簇索引
    非聚簇索引 解析:根据索引的顺序与数据表的物理顺序是否相同可以分为:聚簇索引和非聚簇索引,聚簇索引重新组织表中的数据以按指定的一个或多个列的值排序;非聚簇索引不重新组织表中的数据。

  • 第15题:

    已知关系:STUDENT(sno,sname,grade),以下关于命令 “CREATECLUSTER INDEXS_index ONStudent(grade)”的描述中,正确的是

    A.按成绩降序创建了一个聚簇索引

    B.按成绩升序创建了一个聚簇索引

    C.按成绩降序创建了一个非聚簇索引

    D.按成绩升序创建了一个非聚簇索引


    正确答案:B
    解析:在SQL中创建索引,使用CLUSTER表示要建立的索引是聚簇索引,索引项的顺序与表中记录的物理顺序一致,如果不使用CLUSTER则认为创建的是非聚簇索引。创建索引时可以在表的列名后面确定索引值的排列顺序,包括ASC(升序)和DE-SC(降序)两种,在默认的情况下按照升序排列的。题目中没有指定排列的顺序,按照默认情况是按照grade升序建立的索引。

  • 第16题:

    从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。


    正确答案:错误

  • 第17题:

    以下是哪一个聚类算法的算法流程() ①构造k-最近邻图。 ②使用多层图划分算法划分图。 ③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。

    • A、MST
    • B、OPOSSUM
    • C、Chameleon
    • D、Jarvis-Patrick(JP)

    正确答案:C

  • 第18题:

    如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。


    正确答案:正确

  • 第19题:

    NTFS中一个文件的起始簇号和文件占用的簇数这两个重要信息,从该文件的()属性中可得到


    正确答案:80

  • 第20题:

    单选题
    ()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术。
    A

    MIN(单链)

    B

    MAX(全链)

    C

    组平均

    D

    Ward方法


    正确答案: C
    解析: 暂无解析

  • 第21题:

    单选题
    下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。
    A

    JP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇

    B

    JP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇

    C

    JP聚类是基于SNN相似度的概念

    D

    JP聚类的基本时间复杂度为O(m)


    正确答案: C
    解析: 暂无解析

  • 第22题:

    判断题
    从点作为个体簇开始每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第23题:

    判断题
    如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第24题:

    判断题
    K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。
    A

    B


    正确答案:
    解析: 暂无解析