参考答案和解析
正确答案:(1)要给每个汉字确定一个代码(内码),计算机通过代码就能识别和输出汉字
(2)要给每个汉字的代码确定相关的输入信号(外码),如键盘上的拼音输入.笔画输入等,用键盘字母信号与内码关联.
更多“汉字编码和汉字处理中的语言学知识有哪些?”相关问题
  • 第1题:

    下列有关我国汉字编码标准的叙述中,错误的是( )。

    A、GB18030汉字编码标准与GBK、GB2312标准兼容

    B、GBK汉字编码标准不仅与GB2312标准兼容,还收录了包括繁体字在内的大量汉字

    C、GB18030汉字编码标准中收录的汉字在GB2312标准中一定能找到

    D、GB2312所有汉字的机内码都用两个字节来表示


    正确答案:C

  • 第2题:

    在GB18030汉字编码标准中,常用汉字一般采用______字节编码。


    正确答案:2个
    2个

  • 第3题:

    汉字信息处理的关键技术是汉字编码。

    A

    B



  • 第4题:

    GB18030汉字编码标准中收录的汉字在GBK编码标准中也能找到。生成文字和图表的映像过程模型


    正确答案:错误

  • 第5题:

    计算机中,对非数值的文字和其他符号进行处理时,常使用()。

    • A、BCD码
    • B、机内码
    • C、ASCⅡ编码
    • D、汉字编码

    正确答案:A,C,D

  • 第6题:

    GB18030汉字编码标准中收录的汉字在GBK编码标准中也能找到。


    正确答案:错误

  • 第7题:

    语言学的知识可以用于哪些信息处理技术?


    正确答案:语言学的知识首先可以用于机器翻译,除此之外还有相当广阔的领域.有的简单,如汉字处理,文本检索和数据统计,信息传输,校对和摘要等.有的困难些,如语音的识别言语生成.语义分析.人机对话.人工智能等.这些处理技术需要的语言学知识自然不是相同的,有的主要依赖语料统计知识,如文本的检索.语句统计,词语频率.搭配.图书查询等.有的则必须部分或全部依靠语言规则知识.如文字编码,语音识别.自动校对.词语分类.言语生成.语义分析.有的工作依靠现有的语言学知识远远不够,如机器翻译还因缺少相应的知识无法做到即席准确生动的翻译.

  • 第8题:

    文本检索和数据统计中的语言学知识有哪些?


    正确答案:文本检索跟文字处理有密切的关系.一般说要提供给计算机一定的文字信息,如人名.著作名.刊物名等,计算机就可以自动进行检索和分类统计,如果要收集跟某个词有关的例句,统计词语在不同文本中出现的频率,分析口语文本和书面语文本的语句纯度差异等,计算机也可以给出的目标词语和符号自动完成这些工作.

  • 第9题:

    问答题
    汉字编码和汉字处理中的语言学知识有哪些?

    正确答案: (1)要给每个汉字确定一个代码(内码),计算机通过代码就能识别和输出汉字
    (2)要给每个汉字的代码确定相关的输入信号(外码),如键盘上的拼音输入.笔画输入等,用键盘字母信号与内码关联.
    解析: 暂无解析

  • 第10题:

    填空题
    汉字编码中字形码是汉字的输出方式,它的两种表示方式是()和()。

    正确答案: 点阵,矢量函数
    解析: 暂无解析

  • 第11题:

    判断题
    汉字信息处理的关键技术是汉字编码。
    A

    B


    正确答案:
    解析: 暂无解析

  • 第12题:

    问答题
    简述计算机中如何区分汉字编码和ASCII码。

    正确答案: ASCII码:是用7位二进制数表示的(或用一个字节表示,最高位为“0”),这是事实上的国际标准。
    汉字编码:用连续的两个字节表示,且规定最高位为“1”,这是中国国家标准。
    解析: 暂无解析

  • 第13题:

    下列关于汉字编码的内容:

    ①中日韩统一汉字编码(CJK)是指汉字不论其字义和读音,主要字形相同,编码就相同

    ②BIG5是我国台湾地区计算机使用的汉字编码字符集

    ③GB2312国际字符集中收录了包括简化汉字和繁体汉字

    ④在GB2312中,汉字的排列顺序是按照汉语拼音的顺序进行编排的 正确的有______。

    A.①和②

    B.①和③

    C.②和③

    D.③和④


    正确答案:A

  • 第14题:

    汉字代码体系中汉字地址指()。

    A.确定汉字字形点阵的代码
    B.计算机内部实际处理汉字的汉字编码
    C.汉字在内存中的地址编码
    D.汉字(点阵式)字模库中存储汉字字形信息的逻辑地址码

    答案:D
    解析:
    由于汉字字数繁多,属性丰富,因而汉字代码体系也较复杂,主要包括以下几种:(1)汉字机内码:是汉字在计算机汉字系统内部的表示方法,是计算机汉字系统的基础代码。(2)汉字交换码:是国标汉字(如机内码)进行信息交换的代码标准。(3)汉字输入码:是在计算机标准键盘上输入汉字用到的各种代码体系。(4)汉字点阵码:是在计算机屏幕上显示和在打印机上打印输出汉字的代码体系。(5)汉字字形控制码:为了打印各种风格的字体和字形所制定的代码。在国标GD2312—80中规定,所有的国标汉字及符号分配在一个94行、94列的方阵中,方阵的每一行称为一个“区”,编号为01区到94区;每一列称为一个“位”,编号为01 位到94位,方阵中的每一个汉字和符号所在的区号和位号组合在一起形成的四个阿拉伯数字就是它们的“区位码”。区位码的前两位是它的区号,后两位是它的位号。用区位码就可以唯一地确定一个汉字或符号。因此,汉字代码体系中汉字地址指点阵式字模库中存储汉字字形信息的逻辑地址码。

  • 第15题:

    语料库和语料分析中的语言学知识有哪些?


    正确答案:语料库一般分两种:一是未标注任何附加信息的原始文本,称“生语料库”,也就是一般用于检索和统计的语料,另一种是标注了一定附加信息的加工文本,称“熟语料库”.比如汉语词和词之间连写的,要给出词的切分信息,汉语的词类常常是灵活的,熟语料库要给出不同的词类信息。此外像词语的搭配.词语的语义属性等,也可以加以细致的标注.熟语料库不但需要的语言信息更多,即实际上标注的都是语言学信息,而且反过来对语言学的研究的用处也更大,即可以有目的的对经过标注的语料进行分类和分析,从而获得更多的语言现象参数和语言学知识.语料库在词典编纂和计算机辅助教学等方面也有重要作用.

  • 第16题:

    目前PC机使用的字符集及其编码标准有多种,20多年来我国也颁布了多个汉字编码标准。在下列四个汉字编码标准中,与其他三个汉字编码不兼容的是()。

    • A、GB2312
    • B、GBK
    • C、BIG5
    • D、GB18030

    正确答案:C

  • 第17题:

    汉字编码中字形码是汉字的输出方式,它的两种表示方式是()和()。


    正确答案:点阵;矢量函数

  • 第18题:

    汉字信息处理的关键技术是汉字编码。


    正确答案:正确

  • 第19题:

    哪些信息处理技术应用了语言学的知识?


    正确答案:汉字编码和汉字处理,文本检索和数据统计,语料库和语料分析,语音实验与语音的识别和合成,文本的自动校对和摘要。

  • 第20题:

    计算机中,对非数值的文字和其它符号进行处理时,常用()。

    • A、ASCII编码
    • B、机内码
    • C、汉字编码
    • D、BCD码

    正确答案:A,C,D

  • 第21题:

    问答题
    哪些信息处理技术应用了语言学的知识?

    正确答案: 汉字编码和汉字处理,文本检索和数据统计,语料库和语料分析,语音实验与语音的识别和合成,文本的自动校对和摘要。
    解析: 暂无解析

  • 第22题:

    单选题
    目前PC机使用的字符集及其编码标准有多种,20多年来我国也颁布了多个汉字编码标准。在下列四个汉字编码标准中,与其他三个汉字编码不兼容的是()。
    A

    GB2312

    B

    GBK

    C

    BIG5

    D

    GB18030


    正确答案: A
    解析: 暂无解析

  • 第23题:

    问答题
    语料库和语料分析中的语言学知识有哪些?

    正确答案: 语料库一般分两种:一是未标注任何附加信息的原始文本,称“生语料库”,也就是一般用于检索和统计的语料,另一种是标注了一定附加信息的加工文本,称“熟语料库”.比如汉语词和词之间连写的,要给出词的切分信息,汉语的词类常常是灵活的,熟语料库要给出不同的词类信息。此外像词语的搭配.词语的语义属性等,也可以加以细致的标注.熟语料库不但需要的语言信息更多,即实际上标注的都是语言学信息,而且反过来对语言学的研究的用处也更大,即可以有目的的对经过标注的语料进行分类和分析,从而获得更多的语言现象参数和语言学知识.语料库在词典编纂和计算机辅助教学等方面也有重要作用.
    解析: 暂无解析