第5题:
知识发现(KDD)是数据挖掘(Data Mining)的核心部分
(1) 把KDD看成数据挖捆的一个 特例。 这是早期比较流行的观点,在许多文献可以看到这种说法。 因此,从这个意义上说,数据挖掘就是从数据库、数据仓库以及其他数据存储方式中挖掘有用知识的过程。 这种描述强调了数据挖掘在掘数据形式上的多样性。(2)数据挖掘是KDD过程的一个步骤〈从狭义角度考虑)。 这种观点得到大多数学者认同,有它的合理性。 KDD是一个广义的范畴,它包括数据清洗、数据集成、数据选择、数据转换、数据挖掘、模式生成及评估等一系列步骤。 这样,可以把KDD看成是一些基本功能构件的系统化协同工作系统.而数据挖掘则是这个系统中的一个关键的部分。(3) KDD与 Data Mining 含义相同(从广义角度考虑)。 有些人认为,KDD与 Data Mining只是叫法不一样,它们的含义基本相同。 事实上,在现今的许多文献中,这两个术语仍然不加区分地使用着。 从上面的描述中可以看出,数据挖掘概念可以在不同的技术层面上来理解,但是其核心仍然是从数据中挖掘知识。 数据挖掘定义有广义和狭义之分。 从广义的观点上,数据挖掘是从 大型数据集中,挖掘隐含在其巾的、人们事先不知道的、对决策有用的知识的过程。 从狭义的观点上,可以定义数据挖掘是从 特定形式的数据集中提炼知识的过程。