在文本聚类中,欧氏距离是比较适合的。
第1题:
在k-means或kNN,我们常用欧氏距离来计算最近的邻居之间的距离,有时也用曼哈顿距离,请对比下这两种距离的差别
欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为:
欧氏距离虽然很有用,但也有明显的缺点。它将样品的不同属性(即各指标或各变量量纲)之间的差别等同看待,这一点有时不能满足实际要求。例如,在教育研究中,经常遇到对人的分析和判别,个体的不同属性对于区分个体有着不同的重要性。因此,欧氏距离适用于向量各分量的度量标准统一的情况。曼哈顿距离,我们可以定义曼哈顿距离的正式意义为L1-距离或城市区块距离,也就是在欧几里得空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和。例如在平面上,坐标(x1, y1)的点P1与坐标(x2, y2)的点P2的曼哈顿距离为:
要注意的是,曼哈顿距离依赖座标系统的转度,而非系统在座标轴上的平移或映射。当坐标轴变动时,点间的距离就会不同。通俗来讲,想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。而实际驾驶距离就是这个“曼哈顿距离”,这也是曼哈顿距离名称的来源, 同时,曼哈顿距离也称为城市街区距离(City Block distance)。曼哈顿距离和欧式距离一般用途不同,无相互替代性。
第2题:
欧氏距离测度适用于广播系统中发射点和蜂窝小区中基站位置的选择()
参考答案:正确
第3题:
A.距离聚类
B.层次聚类
C.密度聚类
D.划分聚类
第4题:
A.欧氏距离
B.曼哈顿距离
C.切比雪夫距离
第5题:
若数据量较大,下面哪种方式比较适合()
第6题:
基于机器学习的系统跟基于人工识别的系统有什么差异?()
第7题:
开始将N个样品各自作为一类,将规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离,重复进行两个最近类的合并,每次减少一类,直至所有的样品合并为一类,此种聚类方法是()
第8题:
什么是文本聚类?它和文本分类有何区别于联系?
第9题:
在Word 2003文档中,“段落缩进”是指()
第10题:
第11题:
第12题:
1
2
3
4
第13题:
R型聚类统计量有( )。
A.同号率
B.绝对距离
C.欧氏距离
D.切比雪夫距离
第14题:
A.饼状图
B.柱状图
C.折线图
D.散点图
第15题:
A.高维
B.低维
C.中高维
D.中维
第16题:
连续型属性的数据样本之间的距离有欧氏距离、曼哈顿距离和()
第17题:
比较绝对值距离、马氏距离、欧氏距离判别函数之间的异同点。
第18题:
以下哪个聚类分析的方法是利用统计学定义的距离进行度量()
第19题:
对样本进行聚类,通常采用的相似性统计量有()
第20题:
绝对距离和欧氏距离使用时需要注意哪些问题?
第21题:
系统聚类
快速聚类(k-means)
A和B都可以
A和B都不可以
第22题:
绝对距离
欧氏距离
夹角余弦
相关系数
切比雪夫距离
第23题:
第24题: