关于网络爬虫，说法正确的是A．网络爬虫也叫做网络机器人，可以代替人们自动地在互联网中进行数据信息的采集与整理B．网络爬虫是数据采集的一种方式C．网络爬虫爬取互联网上的信息，不会受到限制D．网络爬虫可以代替手工做很多事情

题目

关于网络爬虫，说法正确的是

A．网络爬虫也叫做网络机器人，可以代替人们自动地在互联网中进行数据信息的采集与整理

B．网络爬虫是数据采集的一种方式

C．网络爬虫爬取互联网上的信息，不会受到限制

D．网络爬虫可以代替手工做很多事情

相似考题

1.()爬行过程中最重要部分就是表单填写及处理。A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫

2.()实现的两个主要目标为保持本地页面集中存储的页面为最新页面和提高本地页面集中页面的质量。A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫

3.以下关于网络爬虫的说法,不正确的是()。A、网络爬虫还可以对网页建立索引B、有些网络爬虫能够从网站抓取内容聚合起来C、有些网络爬虫甚至能发动DDos攻击、发送垃圾邮件等D、隐藏在表单后的信息无法被网络爬虫发现

4.()采集的目标是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫

更多“关于网络爬虫，说法正确的是”相关问题

第1题：

()的爬虫针对的是网页上的数据,所抓取的数据一般要符合一定的模式,或者可以转化或映射为目标数据模式。

A、基于目标网页特征
B、基于领域概念
C、基于目标数据模式
D、深层网络爬虫

参考答案：C
第2题：

如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

A、增量式网络爬虫
B、聚焦网络爬虫
C、DeepWeb爬虫
D、全网爬虫

参考答案：B
第3题：

网络数据采集是指通过网络爬虫或网站公开API等方式从网站上获取数据信息。()

此题为判断题(对，错)。

参考答案：正确
第4题：

关于各种网络爬虫,以下说法不正确的是()。

A、通用网络爬虫通常采用并行工作方式，但需要较长时间才能刷新一次页面。
B、通用网络爬虫适用于为搜索引擎搜索广泛的主题，有较强的应用价值。
C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接，保留有用的链接并将其放入等待抓取的URL队列。
D、增量式爬虫在需要的时候爬行新产生或发生更新的页面，并重新下载所有页面

参考答案：D
第5题：

()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。

A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫

参考答案：B
第6题：

(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫

参考答案：A
第7题：

下列不属于搜索引擎中“搜索器”工作程序的是（）。
A网络机器人
B蜘蛛
C爬虫
DCuteFTP

D
略
第8题：

关于网络爬虫协议文件robots.txt，说法错误的是（）
- A、一个网站可以放多个不同robots文件
- B、robots文件不可以用xml格式命名
- C、disallow用来描述不希望被访问到的一个URL
- D、robots文件可以放在任何位置
正确答案:A,B,D
第9题：

python的主要应用包括（）。
- A、网络爬虫
- B、数据分析
- C、web开发
- D、人工智能
正确答案:A,B,C,D
第10题：

多选题
python的主要应用包括（）。
A
网络爬虫
B
数据分析
C
web开发
D
人工智能

正确答案： A,D
解析：暂无解析
第11题：

单选题
只爬行新产生的、已经发生变化的网页爬虫，在一定程度上能够保证所爬行的页面为更新页面（）。
A
通用网络爬虫
B
聚焦网络爬虫
C
增量式网络爬虫
D
反向网络爬虫

正确答案： B
解析：暂无解析
第12题：

单选题
爬行对象从一些种子URL扩充到整个网络，主要为了门户站点搜索引擎和大型网络服务提供商采集数据（）。
A
通用网络爬虫
B
聚焦网络爬虫
C
增量式网络爬虫
D
反向网络爬虫

正确答案： D
解析：暂无解析
第13题：

网络数据采集一般是通过()或网站公开API等方式从网站上获取数据信息。

A、网络爬虫
B、网站日志
C、HTTP
D、表单

参考答案：A
第14题：

实际的网络爬虫系统通常是几种爬虫技术相结合实现的。()

此题为判断题(对，错)。

参考答案：正确
第15题：

聚焦网络爬虫和通用网络爬虫相比,增加了链接评价模块以及内容评价模块。()

此题为判断题(对，错)。

参考答案：正确
第16题：

()只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费,但是增加了爬行算法的复杂度和实现难度。

A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫

参考答案：B
第17题：

如果要采集指定的数据,则需要使用到(),因为它只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,保存的页面也由于数量少而更新快。

A、聚焦网络爬虫
B、聚焦网络爬虫
C、通用网络爬虫
D、深层网络爬虫

参考答案：A
第18题：

()又称全网爬虫,爬行对象从一些种子URL扩充到整个Web,主要为门户站点搜索引擎和大型Web服务提供商采集数据。

A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫

参考答案：C
第19题：

用户跟踪技术不包括（）。
- A、IP定位
- B、Cookie
- C、网络爬虫
- D、蠕虫病毒
正确答案:D
第20题：

下列不属于搜索引擎中“搜索器”工作程序的是（）。
- A、网络机器人
- B、蜘蛛
- C、爬虫
- D、CuteFTP
正确答案:D
第21题：

检索引擎组成程序包括（）。
- A、网关程序
- B、网络爬虫
- C、网络蜘蛛
- D、网络机器人
- E、编译程序
正确答案:B,C,D
第22题：

单选题
用户跟踪技术不包括（）。
A
IP定位
B
Cookie
C
网络爬虫
D
蠕虫病毒

正确答案： C
解析：暂无解析
第23题：

单选题
选择性地爬行预先定义好的与主题相关的页面，是（）。
A
通用网络爬虫
B
聚焦网络爬虫
C
增量式网络爬虫
D
反向网络爬虫

正确答案： A
解析：暂无解析
第24题：

多选题
检索引擎组成程序包括（）。
A
网关程序
B
网络爬虫
C
网络蜘蛛
D
网络机器人
E
编译程序

正确答案： E,C
解析：暂无解析

题目

相似考题

更多“关于网络爬虫，说法正确的是”相关问题

相关内容