通用网络爬虫
聚焦网络爬虫
增量式网络爬虫
反向网络爬虫
第1题:
A、统一更新法
B、基于分类的更新法
C、个体更新法
D、随机更新法
第2题:
A、增量式网络爬虫
B、聚焦网络爬虫
C、DeepWeb爬虫
D、全网爬虫
第3题:
A、页面内容
B、页面内容和链接
C、链接
D、表单信息
第4题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第5题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第6题:
A、聚焦网络爬虫
B、增量式网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第7题:
用IE的“页面属性”能够设置下列哪个项目______。
A.在web网页上打开视频片段
B.web网页的大小
C.网页的作者
D.web页面的物理地址
第8题:
Server对象的Excute方法和Transfer方法的区别是()
第9题:
网页技术支持的职责是()。
第10题:
测试所制作的网页时,不需要考虑的因素是()
第11题:
对
错
第12题:
保证页面内容的正确性
格式的正确性
链接的有效性,以及页面下载速度的合理性
网页发布工具
第13题:
A、统一更新法
B、基于分类的更新法
C、个体更新法
D、随机更新法
第14题:
A、表层网页是指传统搜索引擎可以索引的页面,以超链接可以到达的静态网页为主构成的Web页面。
B、深层网页是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。
C、深层网页中包含的信息远远少于表层网页。
D、深层网页爬虫主要用于爬去因此在搜索表单后的深层网页。
第15题:
A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。
B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。
C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。
D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面
第16题:
A、统一更新法
B、基于分类的更新法
C、个体更新法
D、随机更新法
第17题:
A、聚焦网络爬虫
B、聚焦网络爬虫
C、通用网络爬虫
D、深层网络爬虫
第18题:
在Google搜索引擎中,对于一个查询,先利用相似度函数计算其相似页面数的多少,然后计算每个页面的重要性的技术是
A.页面等级技术 B.超文本匹配分析技术 C.超链接分析技术 D.分布式爬行网页采集技术
第19题:
使用Internet Explorer浏览网页时,如果当前页已经过期,可以使用什么按钮更新页面
第20题:
理论上,纵使只提交网站的首页,()也会爬行到其他页面
第21题:
关于库的说法错误的是()。
第22题:
插入到网页中的库可以从网页中分离
可以直接修改插入到网页中的库的内容
对库内容进行修改后通常会自动更新插入了库的网页
可以选择【修改】/【库】/【更新页面】命令对添加有库的页面进行更新
第23题:
通用网络爬虫
聚焦网络爬虫
增量式网络爬虫
反向网络爬虫