什么是网页快照?

sharembweb 28次浏览
什么是网页快照?
搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。

搜狗对网页快照介绍
网页快照,英文名叫WebCache,网页缓存。搜狗在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜狗将搜狗Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。
互联网上的网页并不是一成不变的,而是不断增加、删除、改动。因此,搜狗网页数据库中的网页也需要及时更新,既把互联网上网页重新复制一遍。
如果你在你的网站上删除一张网页,那么搜狗数据库中的复制品-网页快照并不会立刻被删除,而是要过一段才会被删除。

搜索引擎工作原理
1、抓取网页
每个独立的搜索引擎都有自己的网页抓取程序爬虫(Spider)。爬虫顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。

内容变更/快照内容错误怎么办?
如果网页内容(无论是内容还是网页标题或者其他信息)已经更改或者发现搜狗网页快照与您的网页内容不一致,在我们下次抓取网站并刷新索引前,网页快照仍然会包含原有的内容。因而这些内容仍然会出现在搜索结果中,您可以申请更新快照(http://fankui.help.sogou.com/index.php/web/web/index?type=2)来告知搜狗更新快照信息。

百度快照为什么会更新?
首先,需要澄清一下网页的抓取频率和快照的更新频率是完全不同的两个概念。

每一个被百度收录的网站,Baiduspider都会根据其网站内容更新的频率不断的检查有无新网页产生,通常情况下,Baiduspider的抓取频率会和网站产生新内容的速度相符,通常说的更新,是指Baiduspider对网页内容的抓取。

每个新抓取或者新检查过的网页,我们都会根据其重要程度以及其时效性价值以不同的速度去创建索引(比如网络热点信息就具有时效性),通常所说的快照更新时间是指索引时间,一些经常有重要内容更新的网页,我们会以更快的速度创建索引。
如果一个网页只是一般的文字变更或者内容没有时效性的价值(比如seo技巧),并不一定会被搜索引擎认为有快速更新索引的价值,即便百度蜘蛛重新抓取了该网页内容,其快照也不一定会快速更新,但这并不意味着它不重要或者百度更新的速度很慢。

快照时间为什么会倒退?
一个重要网页的快照往往会在搜索引擎数据库中保存有多份网页快照,这些快照的抓取时间并不相同。
在一些极特殊情况下,搜索引擎系统可能会选择不同于当前搜索结果中的快照版本,导致出现快照时间倒退的情况。
这对网站在搜索引擎中的表现无任何影响,也并不代表搜索引擎对该网站做了降权处理。

综上,快照的更新与页面中是否出现重要新增内容有直接关联,而与网站本身的“权重”、是否“被K”并无直接关联。


随机内容

表情

共2条评论
  • 网友评论:

    赞一个

    2020-07-24 16:26:24 回复

  • 网友评论:

    学习了

    2020-07-24 16:26:24 回复

友情链接