自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-Words model)和VSM(Vector Space Model)的描述正确的是:A.BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合###SXB###B.VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量###SXB###C.在VSM,即向量空间模型中,所有文档的向量维度的数目都相同##

题目

自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-Words model)和VSM(Vector Space Model)的描述正确的是:

A.BOW,即词袋模型。即为了计算文档之间的相似度,假设可以忽略文档内的单词顺序和语法、句法等要素,将其仅仅看作是若干个词汇的集合###SXB###B.VSM,即向量空间模型。是一种表示文本文档的数学模型。将每个文档表示成同一向量空间的向量###SXB###C.在VSM,即向量空间模型中,所有文档的向量维度的数目都相同###SXB###D.其它答案都不对

相似考题
参考答案和解析
C解析:自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。故答案为C。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。
更多“自然语言处理中为了计算文档之间的相似度,往往需进行文档的量化表示,下面关于BOW(即Bag-Of-Words model)和VSM(Vector Space Model)的描述正确的是:”相关问题
  • 第1题:

    下面关于文档体的说法正确的一项是______。A.文档体以起始标记开始,文档体元素以结束标记</TR

    下面关于文档体的说法正确的一项是______。

    A.文档体以起始标记<TR>开始,文档体元素以结束标记</TR>结尾

    B.严格地讲,使用<BODY>起始和结束标记是必需的

    C.在文档中,必须以严格的ASCII格式输入文本

    D.ASCII字符无需通过特殊的编码系统就能加到文档中


    正确答案:C

  • 第2题:

    DOM(Document Object Model)最适合应用在()。

    A.内存受限时

    B.只有特定的元素需要处理

    C.文档很大

    D.文档必须非顺序地处理


    参考答案:D

  • 第3题:

    关于word的多文档窗口操作,下列叙述不正确的是(?)。

    A.文档窗口可以拆分为两个文档窗口
    B.分别显示文档的不同部分
    C.允许同时打开多个文档进行编辑,且每个文档有一个文档窗口
    D.多个文档窗口之间的内容,可以进行剪切、复制和粘贴等操作

    答案:B
    解析:
    word可以同时保存或关闭多个文档窗口。B项说法错误,而A、C、D三个选项的叙述正确。

  • 第4题:

    使用ShAre Point TeAm Services站点中的文档库,可以直接在网页环境中创建Office XP文档,下面描述正确的是()

    • A、在一个文档库中可以同时创建Word和Excel文档
    • B、在一个文档库中可以同时创建Word、Excel、PowerPoint和FrontPAge文档
    • C、在文档库中只可以创建Word文档
    • D、以上描述均不正确

    正确答案:D

  • 第5题:

    DOM(Document Object Model)定义了文档的()和访问、操纵文档的方法。它为XML、HTML提供了应用程序接口API。


    正确答案:逻辑结构

  • 第6题:

    大多数中文文本分类系统都采用词作为(),称作特征词。这些特征词作为文档的中间表示形式,用来实现文档与文档、文档与用户目标之间的相似度计算。

    • A、自变量
    • B、因变量
    • C、特征项
    • D、向量

    正确答案:C

  • 第7题:

    关于“开始”菜单中的“文档”的描述,正确的是()。

    • A、该计算机上的所有文档都可以在这一菜单中找到
    • B、文档菜单的项目可以清除
    • C、文档的类型只能是文本,而不能是图形
    • D、文档菜单能够存放文件的个数不受限制

    正确答案:B

  • 第8题:

    关于word的多文档窗口操作,下列叙述不正确的是()。

    • A、文档窗口可以拆分为两个文档窗口
    • B、分别显示文档的不同部分
    • C、允许同时打开多个文档进行编辑,且每个文档有一个文档窗口
    • D、多个文档窗口之间的内容,可以进行剪切、复制和粘贴等操作

    正确答案:B

  • 第9题:

    下面关于MVC的说法不正确的是()。

    • A、M表示Model层,是存储数据的地方
    • B、View表示视图层,负责向用户显示外观
    • C、Controller是控制层,负责控制流程
    • D、在MVC架构中jsp通常做控制层

    正确答案:D

  • 第10题:

    下面关于Word的说法中,正确的是()。

    • A、Word只能将文档保存成Word格式
    • B、Word文档只能有文字,不能加入图形
    • C、Word不能实现“所见即所得”的排版效果
    • D、Word能打开多种格式的文档

    正确答案:D

  • 第11题:

    多选题
    以下关于DOM对象说法正确的是()。
    A

    是文档对象模型

    B

    是Document object model的缩写

    C

    是浏览器对象模型

    D

    是Bowers object model的缩写


    正确答案: B,A
    解析: 暂无解析

  • 第12题:

    单选题
    DOM(Document Object Model)最适合应用在()。
    A

    内存受限时

    B

    只有特定的元素需要处理

    C

    文档很大

    D

    文档必须非顺序地处理


    正确答案: C
    解析: 暂无解析

  • 第13题:

    关于Word中的多文档窗口操作,下列叙述中,不正确的是(48)。

    A.一个文档窗口可以拆分为两个文档窗口

    B.允许同时打开多个文档进行编辑,每个文档有一个文档窗口

    C.多个文档编辑工作结束后,关闭文档窗口只能逐个进行

    D.多文档窗口之间也可以进行剪切、粘贴和复制操作


    正确答案:C
    解析:Word的“窗口”菜单中的“拆分”命令可以将一个文档窗口分为两个文档窗口;Word可以同时打开多个文档进行编辑,每个文档都会有一个窗口;多个文档编辑结束后,按住Ctrl键,选择需要关闭的各个文档,单击鼠标右键选择关闭组,即可以同时关闭多个文档;剪切、粘贴和复制可以在多个文档间进行。

  • 第14题:

    下列关于word中的多文档窗口操作,表述不正确的是( )。

    A.通过多文档窗口操作,文档窗口可以拆分成为两个文档窗口
    B.多个文档编辑工作结束,只能全部存盘后才可关闭文档窗口
    C.允许同时打开多个文档进行编辑,每个文档有一个文档窗口
    D.多个文档窗口的内容之间可以进行剪切、粘贴和复制等操作

    答案:B
    解析:
    按住Shift,再按工具栏的 文件 菜单,选择 全部保存 或 全部关闭。

  • 第15题:

    关于XML接口DOM,下列描述错误的是()。

    • A、DOM的全称是“Document  Object  Model”,即文档对象模型
    • B、在应用程序中,基于DOM的XML分析器将一个XML文档转换成一个对象模型的集合(通常称DOM树)
    • C、通过DOM接口,应用程序可以在任意时刻访问XML文档中的任何一部分数据,因此,这种利用DOM接口的机制也被称作随机访问机制
    • D、DOM强制使用树模型访问XML文档中的信息,不适合XML的模式

    正确答案:D

  • 第16题:

    以下关于文档管理的描述中,()是正确的。

    • A、程序源代码清单不属于文档
    • B、文档按项目周期角度可以分为开发文档和管理文档两大类
    • C、文档按重要性和质量要求可以分为重要文档和次要文档
    • D、《软件文档管理指南》明确了软件项目文档的具体分类

    正确答案:D

  • 第17题:

    下列关于计算表示论述中,不正确的是()

    • A、用自然语言表示算法通俗易懂,描述包含分支和循环的算法方便
    • B、流程图是用一些图框表示各种操作,用图形表示算法,直观形象,易于理解
    • C、伪代码是介于自然语言和计算机语言之间的文字和符号来描述算法
    • D、用计算机语言表示算法必须严格所用语言的语法规则

    正确答案:A

  • 第18题:

    关于Django的MVC模式描述正确的是()

    • A、模型(Model),数据存取层:处理与数据相关的所有事务,即如何存取、如何验证有效性、包含哪些行为以及数据之间的关系等
    • B、模板(Template),表现层:处理与表现相关的决定,即如何在页面或其他类型文档中进行显示。
    • C、视图(View),业务逻辑层:存取模型及调取恰当模板的相关逻辑。模型与模板之间的桥梁。
    • D、对比MVC模式,Django的URLconf属于controller部分

    正确答案:A,B,C,D

  • 第19题:

    状态空间表达式(state space model)


    正确答案: 由状态方程与输出方程组成,状态方程是各状态变量的一阶导数与状态、输入之间的一阶微分方程组。输出方程是系统输出与状态、输入之间的关系方程。

  • 第20题:

    关于MVC下面说法正确的是()

    • A、MVC表示模型,视图,控制器
    • B、在model 1体系结构中没有使用Servlet
    • C、model 1体系结构适合小型项目,开发效率较高,但大型项目会有维护问题
    • D、JavaBean可以访问数据库

    正确答案:A,B,C,D

  • 第21题:

    以下关于DOM对象说法正确的是()。

    • A、是文档对象模型
    • B、是Document object model的缩写
    • C、是浏览器对象模型
    • D、是Bowers object model的缩写

    正确答案:A,B

  • 第22题:

    DOM(Document Object Model)最适合应用在()。

    • A、内存受限时
    • B、只有特定的元素需要处理
    • C、文档很大
    • D、文档必须非顺序地处理

    正确答案:D

  • 第23题:

    单选题
    下面关于Word的说法中,正确的是()。
    A

    Word只能将文档保存成Word格式

    B

    Word文档只能有文字,不能加入图形

    C

    Word不能实现“所见即所得”的排版效果

    D

    Word能打开多种格式的文档


    正确答案: C
    解析: 暂无解析

  • 第24题:

    单选题
    使用ShAre Point TeAm Services站点中的文档库,可以直接在网页环境中创建Office XP文档,下面描述正确的是()
    A

    在一个文档库中可以同时创建Word和Excel文档

    B

    在一个文档库中可以同时创建Word、Excel、PowerPoint和FrontPAge文档

    C

    在文档库中只可以创建Word文档

    D

    以上描述均不正确


    正确答案: B
    解析: 暂无解析