niusouti.com

单选题只爬行新产生的、已经发生变化的网页爬虫,在一定程度上能够保证所爬行的页面为更新页面()。A 通用网络爬虫B 聚焦网络爬虫C 增量式网络爬虫D 反向网络爬虫

题目
单选题
只爬行新产生的、已经发生变化的网页爬虫,在一定程度上能够保证所爬行的页面为更新页面()。
A

通用网络爬虫

B

聚焦网络爬虫

C

增量式网络爬虫

D

反向网络爬虫


相似考题
更多“只爬行新产生的、已经发生变化的网页爬虫,在一定程度上能够保证所爬行的页面为更新页面()。”相关问题
  • 第1题:

    增量式爬虫中的()指的是:爬虫根据个体网页的改变频率来重新访问各页面。

    A、统一更新法

    B、基于分类的更新法

    C、个体更新法

    D、随机更新法


    参考答案:C

  • 第2题:

    如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

    A、增量式网络爬虫

    B、聚焦网络爬虫

    C、DeepWeb爬虫

    D、全网爬虫


    参考答案:B

  • 第3题:

    聚焦爬虫爬行策略实现的关键是评价()的重要性,不同的方法计算出的重要性不同,由此导致链接的访问顺序也不同。

    A、页面内容

    B、页面内容和链接

    C、链接

    D、表单信息


    参考答案:B

  • 第4题:

    ()只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费,但是增加了爬行算法的复杂度和实现难度。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:B

  • 第5题:

    ()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:B

  • 第6题:

    (),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。

    A、聚焦网络爬虫

    B、增量式网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:A

  • 第7题:

    用IE的“页面属性”能够设置下列哪个项目______。

    A.在web网页上打开视频片段

    B.web网页的大小

    C.网页的作者

    D.web页面的物理地址


    答案:B

  • 第8题:

    Server对象的Excute方法和Transfer方法的区别是()

    • A、前者执行完调用网页,继续执行当前页面,后者不是。
    • B、前者执行完调用网页,不再继续执行当前页面,后者不是。
    • C、前者转移到调用的网页,执行新的页面,后者不是。
    • D、前者转移到调用的网页,不再执行当前的页面,后者不是。

    正确答案:A

  • 第9题:

    网页技术支持的职责是()。

    • A、提供在线交易帮助
    • B、进行页面更新
    • C、修正页面错误
    • D、提供产品相关下载

    正确答案:C

  • 第10题:

    测试所制作的网页时,不需要考虑的因素是()

    • A、保证页面内容的正确性
    • B、格式的正确性
    • C、链接的有效性,以及页面下载速度的合理性
    • D、网页发布工具

    正确答案:D

  • 第11题:

    单选题
    只爬行新产生的、已经发生变化的网页爬虫,在一定程度上能够保证所爬行的页面为更新页面()。
    A

    通用网络爬虫

    B

    聚焦网络爬虫

    C

    增量式网络爬虫

    D

    反向网络爬虫


    正确答案: B
    解析: 暂无解析

  • 第12题:

    单选题
    选择性地爬行预先定义好的与主题相关的页面,是()。
    A

    通用网络爬虫

    B

    聚焦网络爬虫

    C

    增量式网络爬虫

    D

    反向网络爬虫


    正确答案: A
    解析: 暂无解析

  • 第13题:

    增量式爬虫中的()指的是:爬虫根据网页改变频率将其分为更新较快网页子集和更新较慢网页子集两类,然后以不同的频率访问这两类网页。

    A、统一更新法

    B、基于分类的更新法

    C、个体更新法

    D、随机更新法


    参考答案:B

  • 第14题:

    关于表层网页及深层网页,以下说法不正确的是()。

    A、表层网页是指传统搜索引擎可以索引的页面,以超链接可以到达的静态网页为主构成的Web页面。

    B、深层网页是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。

    C、深层网页中包含的信息远远少于表层网页。

    D、深层网页爬虫主要用于爬去因此在搜索表单后的深层网页。


    参考答案:C

  • 第15题:

    关于各种网络爬虫,以下说法不正确的是()。

    A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。

    B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。

    C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。

    D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面


    参考答案:D

  • 第16题:

    增量式爬虫中的()指的是:爬虫以相同的频率访问所有网页,不考虑网页的改变频率。

    A、统一更新法

    B、基于分类的更新法

    C、个体更新法

    D、随机更新法


    参考答案:A

  • 第17题:

    如果要采集指定的数据,则需要使用到(),因为它只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,保存的页面也由于数量少而更新快。

    A、聚焦网络爬虫

    B、聚焦网络爬虫

    C、通用网络爬虫

    D、深层网络爬虫


    参考答案:A

  • 第18题:

    在Google搜索引擎中,对于一个查询,先利用相似度函数计算其相似页面数的多少,然后计算每个页面的重要性的技术是

    A.页面等级技术 B.超文本匹配分析技术 C.超链接分析技术 D.分布式爬行网页采集技术


    正确答案:A
    Google属于全文搜索引擎,是世界范围内使用率和搜索率较高的搜索引擎之一,主要采用分布式爬行网页采集、页面等级、超文本匹配分析等技术。分布式爬行网页采集技术通常由一个URL服务器将URL列表提供给网络爬行器,每个爬行器同时保持与大约300个网络连接,通过异步输入/输出来管理事件,并通过一定数量的队列来管理获取网页过程中的状态迁移。页面等级技术是一种检索结果的排序算法。对于一个查询,通常先利用相似度函数计算其相似页面数,然后计算每个页面的重要性。超文本匹配分析技术是指对检索词出现在文档中的次数、位置、字体、字号及检索词所在网页链接的内容进行分析,并分别对其给予不同的权重,通过计算得出最新的排列结果。

  • 第19题:

    使用Internet Explorer浏览网页时,如果当前页已经过期,可以使用什么按钮更新页面


    正确答案:D
    在InternetExplorer浏览网页时,通常我们点击刷新按钮更新已过期的页面。

  • 第20题:

    理论上,纵使只提交网站的首页,()也会爬行到其他页面

    • A、System
    • B、gopher
    • C、PSTN
    • D、spider

    正确答案:D

  • 第21题:

    关于库的说法错误的是()。

    • A、插入到网页中的库可以从网页中分离
    • B、可以直接修改插入到网页中的库的内容
    • C、对库内容进行修改后通常会自动更新插入了库的网页
    • D、可以选择【修改】/【库】/【更新页面】命令对添加有库的页面进行更新

    正确答案:B

  • 第22题:

    单选题
    关于库的说法错误的是()。
    A

    插入到网页中的库可以从网页中分离

    B

    可以直接修改插入到网页中的库的内容

    C

    对库内容进行修改后通常会自动更新插入了库的网页

    D

    可以选择【修改】/【库】/【更新页面】命令对添加有库的页面进行更新


    正确答案: B
    解析: 暂无解析

  • 第23题:

    判断题
    聚焦网络爬虫对爬行速度和存储空间要求较高,对爬行的顺序要求相对较低,刷新时间较短。()
    A

    B


    正确答案:
    解析: 暂无解析

  • 第24题:

    单选题
    测试所制作的网页时,不需要考虑的因素是()
    A

    保证页面内容的正确性

    B

    格式的正确性

    C

    链接的有效性,以及页面下载速度的合理性

    D

    网页发布工具


    正确答案: D
    解析: 暂无解析