A.距离
B.特征
C.数字
D.向量
第1题:
自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-Words model)和VSM(Vector Space Model)的描述正确的是:
A.BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合###SXB###B.VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量###SXB###C.在VSM,即向量空间模型中,所有文档的向量维度的数目都相同###SXB###D.其它答案都不对第2题:
2、关于文档的向量表示模型,采用深度学习中的词向量表示模型和传统的单纯基于词频向量表示方法的区别的描述错误的是
A.传统文档的表示一般采用词袋BOW模型,表示为高维向量
B.深度学习中的词向量表示模型通常是一种低维度向量
C.深度学习中的词向量表示模型存在的一个突出问题就是“词汇鸿沟”现象
D.传统方法中词向量表示模型存在一个突出问题就是“词汇鸿沟”现象
第3题:
5、在文本检索中,统计语言模型属于()。
A.向量空间模型
B.概率模型
C.语义模型
D.特征模型
第4题:
自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-Words model)和VSM(Vector Space Model)的描述正确的是:
A.BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合#B.VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量#C.在VSM,即向量空间模型中,所有文档的向量维度的数目都相同#D.其它答案都不对第5题:
23、自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-Words model)和VSM(Vector Space Model)的描述正确的是:
A.BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合#B.VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量#C.在VSM,即向量空间模型中,所有文档的向量维度的数目都相同#D.其它答案都不对