更多“语料库和语料分析中的语言学知识有哪些?”相关问题
  • 第1题:

    21世纪特别是近几年出现的网络语言,也在现代汉语平衡语料库的收人范围,但在语言整体里并不占很大比例。网络语言是小群体语言,跟普通语言的面貌不太一样,虽然比较刺激眼球,实际上占语言整体总量比例并不大。语料库会从博客、微博和论坛里采集语料资源,但网络语言仅作为现代汉语整体情况的一个补充,不是重要组成部分。 对本段文字概括最恰当的是( )。

    A. 21世纪特别是近几年出现的网络语言也被收入了现代汉语平衡语料库
    B.网络语言多出现在博客、微博和论坛上,跟普通语言的面貌不太一样
    C.网络语言是现代汉语整体情况的一个补充,在其中所占比例不大
    D.现代汉语平衡语料库重新编录,网络语言也在其中占据了一定比例

    答案:C
    解析:
    文段为总一分结构,首句为文段主旨句,由关联词“但”引出本段文字论述的重点,即网络语言在语言整体里所占比重不大。A、B项所述非文段重点。D项论述主体错误,文段的论述主体是“网络语言”,而不是“现代汉语平衡语料库”,故排除D项。本题正确答案为C。

  • 第2题:

    简述文本的自动校对和摘要中的语言学知识。


    正确答案:文稿校对对有些语言来说比较简单,如英语的拼写检查,只要计算机中储存一部词典和词形变化词表即可,语法错误也可以通过限定的动词和其他的词语的关系来判断.对于一些语言――如汉语来说,文稿校对就比较困难,看字形无法判断文字的正误,而词语是否写错须先切分词再联系上下文才能看出来,这就需要向计算机提供词语切分和搭配的更多信息.文稿摘要一方面是利用语料库信息,如选择时间,地点.动作等要素词语,文本中复现频率最高的关键词语和各自然的首句等.同时也要利用必要的语言学知识,如把重要的语句用一定的关联词语加以连接等.

  • 第3题:

    汉字编码和汉字处理中的语言学知识有哪些?


    正确答案:(1)要给每个汉字确定一个代码(内码),计算机通过代码就能识别和输出汉字
    (2)要给每个汉字的代码确定相关的输入信号(外码),如键盘上的拼音输入.笔画输入等,用键盘字母信号与内码关联.

  • 第4题:

    文本检索和数据统计中的语言学知识有哪些?


    正确答案:文本检索跟文字处理有密切的关系.一般说要提供给计算机一定的文字信息,如人名.著作名.刊物名等,计算机就可以自动进行检索和分类统计,如果要收集跟某个词有关的例句,统计词语在不同文本中出现的频率,分析口语文本和书面语文本的语句纯度差异等,计算机也可以给出的目标词语和符号自动完成这些工作.

  • 第5题:

    社会语言学有广义和狭义之分。广义的社会语言学和狭义的社会语言学各包含哪些内容?


    正确答案: 从语言的社会属性出发,用社会学的方法研究语言,从社会的角度解释语言变体和语言演变。
    社会语言学,顾名思义,与社会有关,也与语言有关,是研究语言与社会相互关系的学科,是语言学的重要分支之一。目前它的定义在学术界还有一些分歧,大致可以分为广义和狭义。广义的社会语言学也称为宏观语言学,是一门多学科性交叉学科;从它发展的趋向来看,它不只是社会若干学科的交叉,而且是社会科学和自然科学的结合部之一。语言学,社会学,历史学,人类学,民族学,民俗学,考古学,国土学,心理学,概率论,控制论,信息论,系统论,神经科学等等学科,都会在这个结合部中发挥作用形成一个边缘学科。社会语言学是富有强大生命力的。狭义的社会语言学,社会语言学主要研究“什么人在什么场合对什么人说什么”。其中包含:“语言”,“语言使用者”,“语言使用场合”。人与社会情景合起来就是社会因素。社会语言学回答的就是语言与使用者的关系:谁对谁是用什么样的语言以及语言与语言情景的关系。

  • 第6题:

    偏误分析包括选择语料、确定语料中的偏误、将偏误分类、()和评价偏误五个步骤。


    正确答案:解释偏误

  • 第7题:

    判断题
    从事社会语言学研究,既要具有语言学的基础知识,又要对相关学科知识有必要的了解和掌握。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第8题:

    单选题
    速录与录音机的区别是应用范围不同、()以及记录的信息量不同。
    A

    语料库不同

    B

    声音辨识能动性不同

    C

    时效性不同

    D

    交互式语言的处理方法不同


    正确答案: C
    解析: 暂无解析

  • 第9题:

    填空题
    研制“汉语____语料库系统”可以为对外汉语教学总体设计、教材编写、课堂教学、成绩测试和水平考试的研究工作提供依据。

    正确答案: 中介语
    解析:
    建立汉语中介语语料库的基本目的,是为对外汉语教学的学科建设做一项基础性的准备工作,同时也为有关的汉语本体研究、汉外语言对比和语言共性研究以及其他相关的研究工作提供来自汉语中介语方面的语料和数据。

  • 第10题:

    填空题
    偏误分析包括选择语料、确定语料中的偏误、将偏误分类、()和评价偏误五个步骤。

    正确答案: 解释偏误
    解析: 暂无解析

  • 第11题:

    问答题
    为什么说语言学规则知识和语料库知识都可以用于语言信息处理?

    正确答案: 语料库知识作为一种概率统计知识虽然是不够系统或不够科学的,但在目前语言学研究还不能提供更有效的原则和规则的情况下也不失为一条捷径,而且这种研究也能为最终建立适用于计算机信息处理的语言学规则系统提供语料统计支持。语言学规则知识可能比较系统或比较科学,但现在还拿不出一套现成可用的方案.就不如先用语料库知识来做可能做到的事情,而且最终真正建立完整可靠的语言学规则也应该能与计算器处理的语料统计知识相匹配。因此,语言学规则知识和语料库知识都可以用于语言信息处理。
    解析: 暂无解析

  • 第12题:

    问答题
    结合教学实践,谈谈语料库技术在对外汉语教学中的作用。

    正确答案:
    (1)现代汉语语料库为对外汉语教学工作者提供有力的帮助
    建设现代汉语语料库是一项非常有意义和非常基础的工程。我们可以用它来辅助制定教学大纲、编写教材、查找例句、编写教案、编出试题,等等。现代汉语语料库的建立要经历原始语料收集、提取粗语料、提取精语料几个过程。现代汉语语料库的加工主要是进行语料的分词和词性标注工作。这是实现检索与统计的前提。而分词必须要有一个可操作性强、高度具体化的分词规范。
    (2)现代汉语句型语料库为对外汉语的研究提供科学数据
    现代汉语句型统计与研究是一项通过对文本语料进行句型分类统计和句法结构分析,从而对现代汉语进行句型调查和研究的基础工程。调查现代汉语句型的使用频率,研制出一个体现汉语特点、突出汉语语法教学重点的常用句型表,建立一个经过专家分析研究的句型语料库,是非常有意义的。这项工程的成果,应该能为对外汉语教学的教材建设、语法教学、汉外对比研究以及汉语水平测试提供有关句型方面的科学数据和丰富例句。
    (3)汉语中介语语料库有利于对外汉语教学
    中介语有两个主要的性质和特点:一是不断发展变化;二是它的发展变化有一定的内在规律,表现出一种普遍性或群体性的特征。正因为中介语的规律性和系统性,我们才可以描写中介语的面貌,揭示中介语发展的总体特征和群体特征,并找出影响中介语发展的主观和客观条件。汉语中介语语料库对对外汉语教学的作用主要以现在:
    ①为对外汉语教学的学科建设做一项基础性的准备工作,同时也为有关的汉语本体研究、汉外语言对比和语言共性研究,以及其他相关的研究工作提供来自汉语中介语方面的语料和数据。
    ②“汉语中介语语料库系统”为对外汉语教学总体设计、教材编写、课堂教学、成绩测试和水平考试的研究工作提供依据。
    ③在教学实践方面,它可以帮助老师了解学生的学习过程和影响学习进步的因素,从而使教师有效地优化影响学习的条件,自觉地按照学习规律组织教学、提高教学的效率。
    (4)面向语言学研究的汉语语料检索系统
    语言学研究需要以语言事实作为依据。过去,主要通过研究者用卡片大量摘录语言材料,这种方法因受到数据规模的限制而效率较低。近十几年出现了大量的电子文档,可以组成大规模的电子语料库,并出现了相当成熟的文本信息检索技术。这一技术可用于电子文档中的语言事实的检索。比起人工收集语言事实,这种方法的好处是效率高,可以在极短的时间内,在大规模电子语料库中找到相关文本的文章、段落、句子;结果可以编辑、复制、打印;查询表达式可以是关键词语同逻辑符号组合成的复杂的关系式。
    (5)汉语教学多媒体素材库和资源库的作用
    素材库应当既反映汉语静态的知识结构,如包括汉字、词汇、语法、句型、情景等知识性素材,也包含动态的汉语教学过程的内容,如经典的示范、讲解的视频录像等。对于一个汉语教师或者教材编写者,他们可以从多媒体素材库中得到教学科研所需要的绝大部分资料,从而节省大量的人力和财力。
    建立对外汉语教学多媒体素材库是工业化时代所产生的模块化、标准化思维方式的自然推论,也是数据库技术应用的必然拓展。模块化和标准化的核心是同一客体的拷贝和重复使用,它是与高效率、高速度和规范化密切相关的。多媒体素材库在汉语教学领域也应产生这样的效果。
    解析: 暂无解析

  • 第13题:

    社会语言学自20世纪60年代兴起以来,搜集语料和定量分析的惯用方法是()两种。

    • A、人工调查
    • B、定性分析
    • C、概率统计
    • D、人脑统计

    正确答案:A,D

  • 第14题:

    语言学在历史学和考古学中的应用有哪些?


    正确答案:中国甲骨文和金文的辨认全靠汉代语言学家许慎给我们留下了一部《说文解字》,而甲骨文和金文的解读则大大促进了中国古代史的研究古埃及的文字没人能认读,后来语言学家解读了在一块石碑上刻下的这种文字和古希腊文对照的铭文,才解开了古埃及文字之谜,美洲玛雅文字的解读则揭开了欧洲人来美洲以前印第安人历史的神秘面纱。

  • 第15题:

    从事社会语言学研究,既要具有语言学的基础知识,又要对相关学科知识有必要的了解和掌握。


    正确答案:正确

  • 第16题:

    速录与录音机的区别是应用范围不同、()以及记录的信息量不同。

    • A、语料库不同
    • B、声音辨识能动性不同
    • C、时效性不同
    • D、交互式语言的处理方法不同

    正确答案:B

  • 第17题:

    为什么说语言学规则知识和语料库知识都可以用于语言信息处理?


    正确答案: 语料库知识作为一种概率统计知识虽然是不够系统或不够科学的,但在目前语言学研究还不能提供更有效的原则和规则的情况下也不失为一条捷径,而且这种研究也能为最终建立适用于计算机信息处理的语言学规则系统提供语料统计支持。语言学规则知识可能比较系统或比较科学,但现在还拿不出一套现成可用的方案.就不如先用语料库知识来做可能做到的事情,而且最终真正建立完整可靠的语言学规则也应该能与计算器处理的语料统计知识相匹配。因此,语言学规则知识和语料库知识都可以用于语言信息处理。

  • 第18题:

    外语教学种的语言学知识包括哪些?


    正确答案:外语教学中的语言学知识包括两类:
    (1)非系统的零星知识,即必须一点一点记住的语言现象。
    (2)系统的理论知识,即可以一类一类掌握的语育规则。

  • 第19题:

    问答题
    汉字编码和汉字处理中的语言学知识有哪些?

    正确答案: (1)要给每个汉字确定一个代码(内码),计算机通过代码就能识别和输出汉字
    (2)要给每个汉字的代码确定相关的输入信号(外码),如键盘上的拼音输入.笔画输入等,用键盘字母信号与内码关联.
    解析: 暂无解析

  • 第20题:

    问答题
    简述建立汉语中介语语料库的基本目的。

    正确答案:
    建立汉语中介语语料库是为对外汉语教学的学科建设做一项基础性的准备工作
    (1)汉语中介语语料库为汉语本体研究、汉外语言对比和语言共性研究提供中介语方面语料和数据。
    (2)汉语中介语语料库为对外汉语教学总体设计、教材编写、课堂教学、成绩测试和水平考试的研究工作提供依据。
    (3)汉语中介语语料库的建立有利于提高教学效率
    在教学实践方面,它可以帮助老师了解学生的学习过程和影响学习进步的因素,从而使教师有效地优化影响学习的条件,自觉地按照学习规律组织教学、提高教学的效率。
    解析: 暂无解析

  • 第21题:

    问答题
    文本检索和数据统计中的语言学知识有哪些?

    正确答案: 文本检索跟文字处理有密切的关系.一般说要提供给计算机一定的文字信息,如人名.著作名.刊物名等,计算机就可以自动进行检索和分类统计,如果要收集跟某个词有关的例句,统计词语在不同文本中出现的频率,分析口语文本和书面语文本的语句纯度差异等,计算机也可以给出的目标词语和符号自动完成这些工作.
    解析: 暂无解析

  • 第22题:

    问答题
    语料库和语料分析中的语言学知识有哪些?

    正确答案: 语料库一般分两种:一是未标注任何附加信息的原始文本,称“生语料库”,也就是一般用于检索和统计的语料,另一种是标注了一定附加信息的加工文本,称“熟语料库”.比如汉语词和词之间连写的,要给出词的切分信息,汉语的词类常常是灵活的,熟语料库要给出不同的词类信息。此外像词语的搭配.词语的语义属性等,也可以加以细致的标注.熟语料库不但需要的语言信息更多,即实际上标注的都是语言学信息,而且反过来对语言学的研究的用处也更大,即可以有目的的对经过标注的语料进行分类和分析,从而获得更多的语言现象参数和语言学知识.语料库在词典编纂和计算机辅助教学等方面也有重要作用.
    解析: 暂无解析

  • 第23题:

    多选题
    社会语言学自20世纪60年代兴起以来,搜集语料和定量分析的惯用方法是()两种。
    A

    人工调查

    B

    定性分析

    C

    概率统计

    D

    人脑统计


    正确答案: C,B
    解析: 暂无解析