高中信息技术《网海寻珠-搜索引擎的工作原理》 一、考题回顾 题目来源:2019年5月19日北京市面试考题 试讲题目 1.题目:搜索引擎的工作原理 2.内容: 搜索引擎的工作原理 搜索引擎不能真正实时地在因特网上捜索信息,而是搜索预先整理好的网页索引数据库。它不能真正理解网页上的内容, 只能机械的匹配网页上的文字。 真正意文上的搜索引擎,通常指收集了因特网上几千万乃至几十亿个网页并对网页中的每一个词(搜索的关键词)进行索引。建立索引数据库的全文搜索引擎。当用户输入某个关键词进行检索时,所有页面内容中包含了该

题目
高中信息技术《网海寻珠-搜索引擎的工作原理》
一、考题回顾
题目来源:2019年5月19日北京市面试考题
试讲题目
1.题目:搜索引擎的工作原理
2.内容:
搜索引擎的工作原理
搜索引擎不能真正实时地在因特网上捜索信息,而是搜索预先整理好的网页索引数据库。它不能真正理解网页上的内容, 只能机械的匹配网页上的文字。
真正意文上的搜索引擎,通常指收集了因特网上几千万乃至几十亿个网页并对网页中的每一个词(搜索的关键词)进行索引。建立索引数据库的全文搜索引擎。当用户输入某个关键词进行检索时,所有页面内容中包含了该关键词的网页都被作为搜索结果进行处理。在经过一些算法进行排序后,搜索到的结果最终按照与搜索关键词相关程度的高低依次排列出来。
搜索引擎的整个工作过程可以简单的理解为三步:一是从互联网上抓取网页,二是建立索引数据库,三是在索引数据库中对搜索结果进行排序,如图3-2-4所示。



1.从因特网上抓取网页
搜索引擎利用能够从因特网上自动收集网页的“蜘蛛”(Spider)系统程序,自动访问因特网,沿着网页中的所有链接“爬”到其他网页,重复这一过程,并把所有“爬”过的网页收集过来。
2.建立索引数据库
分析索引程序对收集回来的网页进行分析,提取相关网页信息,包括网页的URL,编码类型,页面内容包含的所有关键词,关键词的位置、生成时间、大小、与其他网页的链接关系等,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字及链接中每一个关键词的相关程度(或重要性),然后用这些相关信息建立网页索引数据库。
3.在索引数据库中对搜索结果进行排序
当用户输人关键词搜索后,搜索系统程序就从网页索引数据库中查找与该关键词相匹配的所有网页。然后根据这些网页与关键词的相关程度,对搜索到的数值进行排序。一般来讲,相关程度越高,排的次序越靠前。
3.基本要求:
(1)请在10分钟内完成试讲。
(2)配合讲解过程中要有学生参与。
(3)试讲过程中涉及操作,进行演示即可。
答辩题目1.本节课你是通过什么方式进行小结?
2.请你说出搜索引擎的工作过程?


相似考题
更多“高中信息技术《网海寻珠-搜索引擎的工作原理》 ”相关问题
  • 第1题:

    根据原理和工作机制的不同,搜索引擎可以划分为()

    • A、元搜索引擎
    • B、独立搜索引擎
    • C、混合搜索引擎
    • D、集成搜索引擎

    正确答案:A,B,D

  • 第2题:

    独立型搜索引擎的工作原理是什么?


    正确答案:独立式搜索引擎的工作原理是:定期运行搜索软件(或人工),搜集网络信息。利用索引软件进行自动标引,建立数据库。以Web页面形式向用户提供有关的信息资源导航、目录索引及检索界面,由用户输入检索式。通过检索软件进行检索,匹配,按相关度排序输出。

  • 第3题:

    高中压自动关闭器的工作原理?


    正确答案: 高中压自动关闭器执行机构接受DEH控制系统来的控制信号,其开关电磁阀(该电磁阀为二位四通常闭电磁阀)在得到DEH控制系统发出的控制信号后,失电关闭,这样卸荷阀上腔自动停机危急遮断控制油(即AST控制油)通往有压回油的通路被封闭,卸荷阀的滑阀在其上腔AST油压和弹簧的作用下关闭,此时高压抗燃油经节流孔进入该执行机构油缸和卸荷阀的下部,在油压的作用下,该执行机构克服蒸汽在阀门上作用力、摩擦力、阀门本身的重力和操纵座弹簧力而开启高压主汽门,当高压主汽门运动到限位行程后,操纵座上的行程开关触点闭合,同时发出一个节点信号给DEH,表明该主汽门已全开。
    在该油动机的集成块上,有一个卸荷阀,用于汽轮机停机时速关闭主汽门。
    有一个活动试验电磁阀,用于进行主汽门活动试验。

  • 第4题:

    以下搜索引擎的工作原理不包括()。

    • A、搜集信息
    • B、整理信息
    • C、接受查询
    • D、保存信息

    正确答案:D

  • 第5题:

    简述搜索引擎的原理。


    正确答案: (1)数据的采集和存储;
    (2)数据分析与标引;
    (3)数据组织;
    (4)数据检索;
    (5)检索结果的相关性处理。

  • 第6题:

    下列哪一项不是主流搜索引擎的工作原理?()

    • A、爬行和抓取
    • B、索引
    • C、预处理
    • D、人工编辑干预搜索引擎收录的网站标签

    正确答案:D

  • 第7题:

    互联网主流搜索引擎的工作原理包括哪几点?()

    • A、爬行
    • B、抓取
    • C、索引
    • D、预处理

    正确答案:A,B,C,D

  • 第8题:

    简单描述全文搜索引擎的工作原理及特点。


    正确答案: 全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全文搜索引擎的方法主要分为按字检索和按词检索两种。按字检索是指对文章中的每一个字都建立索引,检索时将词分解为字的组合。对于各种不同的语言而言,字有不同的含义,比如英文中字与词实际上是合一的,而中文中字与词有很大分别。按词检索指对文章中的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项等。英文等西方文字由于按照空白切分词,因此实现上与按字处理类似,添加同义处理也很容易。中文等东方文字则需要切分字词,以达到按词索引的目的,关于这方面的问题,是当前全文检索技术尤其是中文全文检索技术中的难点。全文搜索引擎系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。一般来说,全文检索需要具备建立索引和提供查询的基本功能,此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。功能上,全文检索系统核心具有建立索引、处理查询返回结果集、增加索引、优化索引结构等功能,外围则由具有各种不同应用的功能组成。结构上,全文搜索引擎系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等等,加上各种外围应用系统等等共同构成了全文检索系统。最常用的全文搜索引擎有百度、谷歌(GooglE.等,与之相对应的是目录索引类搜索引擎。

  • 第9题:

    在发动机控制中,闭环控制是按()工作的.

    • A、偏离原理
    • B、补偿原理
    • C、优化原理
    • D、寻优原理

    正确答案:A

  • 第10题:

    问答题
    论述搜索引擎的种类及工作原理,并说明企业注册每种搜索引擎时的策略。

    正确答案: 一、搜索引擎的种类:主动式和被动式两种。
    二、工作原理:主动式是利用机器程序来搜索互联网上的网站资源,并对其基本资料进行分类和整理,录入后台数据库;而被动式搜索引擎的以上过程都由人工来完成。
    三、二者区别:
    1.获取站点资料的手段和方式不同
    2.组织信息的方法不一样
    3.显示结果的方法不同
    4.搜索信息准确度各有千秋
    5.注册时网站推广人员的自我控制程度不同
    四、注册技巧:
    1.不要过早的进行注册
    2.要主动进行注册
    3.确定需要注册的搜索引擎站点
    4.通过调整关键词使页面的级别最小
    5.建议使用商业化的搜索引擎注册
    6.重视冲浪者的利益
    解析: 暂无解析

  • 第11题:

    问答题
    独立型搜索引擎的工作原理是什么?

    正确答案: 独立式搜索引擎的工作原理是:定期运行搜索软件(或人工),搜集网络信息。利用索引软件进行自动标引,建立数据库。以Web页面形式向用户提供有关的信息资源导航、目录索引及检索界面,由用户输入检索式。通过检索软件进行检索,匹配,按相关度排序输出。
    解析: 暂无解析

  • 第12题:

    问答题
    简述各种搜索引擎的工作原理和使用方法。

    正确答案: 各种搜索引擎的工作原理和使用方法分别是:
    (1)全文搜索引擎。具有代表性的全文搜索引擎有G-oogle和百度。用户可以用逻辑组合的形式输入各种关键词(keyworD.,搜索引擎将根据这些关键词从数据库中寻找用户所需资源的地址,然后按一定的排列顺序将结果返回给用户。
    (2)目录索引搜索引擎。目录索引虽然有搜索功能,但在严格意义上讲不是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词查询,仅靠分类目录就可找到需要的信息。它们将Intemet上的信息资源按文字顺序或时间顺序汇总整理成目录结构,用户通过逐级浏览这些目录来寻找自己需要的网址或相关内容。
    (3)元搜索引擎。元搜索引擎是一种调用其他独立搜索引擎的引擎。元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。
    解析: 暂无解析

  • 第13题:

    论述搜索引擎的种类及工作原理,并说明企业注册每种搜索引擎时的策略。


    正确答案: 一、搜索引擎的种类:主动式和被动式两种。
    二、工作原理:主动式是利用机器程序来搜索互联网上的网站资源,并对其基本资料进行分类和整理,录入后台数据库;而被动式搜索引擎的以上过程都由人工来完成。
    三、二者区别:
    1.获取站点资料的手段和方式不同
    2.组织信息的方法不一样
    3.显示结果的方法不同
    4.搜索信息准确度各有千秋
    5.注册时网站推广人员的自我控制程度不同
    四、注册技巧:
    1.不要过早的进行注册
    2.要主动进行注册
    3.确定需要注册的搜索引擎站点
    4.通过调整关键词使页面的级别最小
    5.建议使用商业化的搜索引擎注册
    6.重视冲浪者的利益

  • 第14题:

    光电鸣音式寻边器测头采用()式工作原理。

    • A、导电
    • B、感应
    • C、机械
    • D、偏置

    正确答案:A

  • 第15题:

    搜索引擎按照工作原理划分,一般分为()。

    • A、全文搜索引擎
    • B、桌面搜索引擎
    • C、垂直搜索引擎
    • D、分类目录

    正确答案:A,D

  • 第16题:

    搜索引擎按照工作原理不同一般分为()。

    • A、元搜索引擎
    • B、自动搜索引擎
    • C、全文搜索引擎
    • D、分类目录

    正确答案:C,D

  • 第17题:

    下列哪一项不是目前主流搜索引擎的工作原理()。

    • A、爬行和抓取
    • B、索引
    • C、预处理
    • D、人工编辑干预搜索引擎收录的网站描述标签

    正确答案:B,C

  • 第18题:

    主流搜索引擎的工作原理有()。

    • A、爬行和抓取
    • B、索引
    • C、预处理
    • D、搜索触发

    正确答案:A,B,C

  • 第19题:

    简述各种搜索引擎的工作原理和使用方法。


    正确答案: 各种搜索引擎的工作原理和使用方法分别是:
    (1)全文搜索引擎。
    具有代表性的全文搜索引擎有G-oogle和百度。用户可以用逻辑组合的形式输入各种关键词(keyword),搜索引擎将根据这些关键词从数据库中寻找用户所需资源的地址,然后按一定的排列顺序将结果返回给用户。
    (2)目录索引搜索引擎。
    目录索引虽然有搜索功能,但在严格意义上讲不是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词查询,仅靠分类目录就可找到需要的信息。它们将Intemet上的信息资源按文字顺序或时间顺序汇总整理成目录结构,用户通过逐级浏览这些目录来寻找自己需要的网址或相关内容。
    (3)元搜索引擎。
    元搜索引擎是一种调用其他独立搜索引擎的引擎。元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。

  • 第20题:

    简述搜索引擎的工作原理。


    正确答案:①从互联网上抓取网页,
    ②建立索引数据库,
    ③在索引数据库中搜索排序。

  • 第21题:

    问答题
    简单描述全文搜索引擎的工作原理及特点。

    正确答案: 全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全文搜索引擎的方法主要分为按字检索和按词检索两种。按字检索是指对文章中的每一个字都建立索引,检索时将词分解为字的组合。对于各种不同的语言而言,字有不同的含义,比如英文中字与词实际上是合一的,而中文中字与词有很大分别。按词检索指对文章中的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项等。英文等西方文字由于按照空白切分词,因此实现上与按字处理类似,添加同义处理也很容易。中文等东方文字则需要切分字词,以达到按词索引的目的,关于这方面的问题,是当前全文检索技术尤其是中文全文检索技术中的难点。全文搜索引擎系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。一般来说,全文检索需要具备建立索引和提供查询的基本功能,此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。功能上,全文检索系统核心具有建立索引、处理查询返回结果集、增加索引、优化索引结构等功能,外围则由具有各种不同应用的功能组成。结构上,全文搜索引擎系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等等,加上各种外围应用系统等等共同构成了全文检索系统。最常用的全文搜索引擎有百度、谷歌(GooglE.等,与之相对应的是目录索引类搜索引擎。
    解析: 暂无解析

  • 第22题:

    多选题
    搜索引擎按照工作原理划分,一般分为()。
    A

    全文搜索引擎

    B

    桌面搜索引擎

    C

    垂直搜索引擎

    D

    分类目录


    正确答案: A,C
    解析: 暂无解析

  • 第23题:

    多选题
    根据原理和工作机制的不同,搜索引擎可以划分为()
    A

    元搜索引擎

    B

    独立搜索引擎

    C

    混合搜索引擎

    D

    集成搜索引擎


    正确答案: A,C
    解析: 暂无解析

  • 第24题:

    多选题
    搜索引擎按照工作原理不同一般分为()。
    A

    元搜索引擎

    B

    自动搜索引擎

    C

    全文搜索引擎

    D

    分类目录


    正确答案: A,C
    解析: 暂无解析