()通过将属性域划分为区间,从而减少给定连续值的个数。
A 概念分层
B 离散化
C 分箱
D 直方图
第1题:
使用等距离分箱法进行数据离散化,数据范围为20, 40, 50, 58, 65, 80, 80, 82, 86, 90, 96, 105, 120, 200,区间个数为4。下列属于4个箱的区间是()。
A.[110,155)
B.[20,65]
C.(65,110)
D.(155,200]
第2题:
4、下面关于直方图的说法中,错误的是_________。
A.直方图的横坐标按区间个数等分
B.每个区间上长方形的高度表示该区间样本的频率
C.分箱的数量与数据集的分布无关
D.直方图可用来描述总体的频数分布情况
第3题:
在结构化数据中进行关联分析发现其中的频繁模式和关联规则。对于取值连续的属性,首先将其离散化,然后将每个取值区间作为一个值,继而转化为“属性=值”的形式。
第4题:
13、在结构化数据中进行关联分析发现其中的频繁模式和关联规则。对于取值连续的属性,首先将其离散化,然后将每个取值区间作为一个值,继而转化为“属性=值”的形式。
第5题:
使用等距离分箱法进行数据离散化,数据范围为20, 40, 50, 58, 65, 80, 80, 82, 86, 90, 96, 105, 120, 200,区间个数为4。下列属于4个箱的区间是()。
A.[20,65]
B.(65,110)
C.[110,155)
D.(155,200]