Categories


Tags


【官方说法】详谈百度快照前世今生

谈到百度快照,很多站长都很重视,快照的展示样式和内容也是站长们关注的重点;在过去一年中攻城狮们接收到很多站长的投诉反馈,主要集中在如下几个方面:

1、快照的排版错乱问题,页面内容展示不全

2、没有网页快照

3、网页快照内容的更新问题

4、网页已经死链,但快照仍然存在

例如搜索『codercar.com』出来的百度快照截图,请注意红框部分的描述。

这次学堂君请攻城狮来把百度快照的生成逻辑梳理下,详细给大家讲解下为什么会出现这些问题,以及如何解决这些问题。

站长可以理解为百度快照的生成流程跟网页的索引更新是同步的,生成索引的同时会将爬虫最新一次抓取的网页内容推给快照生成程序。所以可以说网页建索引的速度决定了快照更新的速度。

快照生成模块会将网页内容通过浏览器展示给用户,目前快照展示模块只能根据静态的html进行网页渲染(行话是指通过iframe方式加载),所以对于一些相对路径下的js,css和图片等素材是无法进行加载的,或者部分网站禁用了百度域对js,css等文件的访问,都会导致快照展示出现排版错误和页面部分内容展示不全,对于这种情况站长可以根据实际需要进行整改。

对于没有快照信息的情况,也请站长不要紧张,这里只是没有针对该网页生成快照,并不是针对该网站进行了某些特殊处理。

另外站长投诉反馈最多的就是快照更新慢的问题,这涉及到快照更新的频率问题,不同的网页更新周期不一样,不同网站的网页更新频率也不一样,这里可以透露最长的更新周期是月级别,最短的更新周期是分钟级别。

对于涉及到敏感信息在百度快照上的更新问题,这里给广大站长推荐一个靠谱的方法,将涉敏感信息的网页做死链处理,然后在百度快照页面进行『投诉快照』处理;这个方法同样适用于『网页已经死链,但快照仍然存在』。

如何进行『快照投诉』,请参考历史文章《【大拿分享】快照错误或更新不及时如何向百度投诉》

来源:百度搜索资源平台 百度搜索学堂


Public @ 2011-09-09 15:34:25

不能正常访问360搜索

如果您不能正常访问360搜索,您可以尝试以下方法:确认您的网络是否存在问题,您可以访问一下其他网站看看是否也有类似的问题。清除浏览器的缓存,并将cookie删除。确认您的dns缓存是否存在异常。确认您的hosts文件,确认是否针对360搜索的域名做了跳转。

Public @ 2016-10-08 16:22:48

如何让我的网页不被搜狗收录?

如果您希望您的网页不被搜狗搜索引擎收录,您可以尝试以下方法: 1. 使用robots.txt文件:在网站的根目录下创建一个名为robots.txt的文件,并在文件中添加以下内容: User-agent: Sogou Disallow: / 这将告诉搜狗搜索引擎不要访问和收录您的网站。 2. 使用META标签:在您的网页的头部添加以下META标签: 这将告诉搜索引擎不要索引这个特定的网

Public @ 2023-07-24 08:00:15

内容变更/快照内容错误怎么办?

如果网页内容(无论是内容还是网页标题或者其他信息)已经更改或者发现搜狗网页快照与您的网页内容不一致,在我们下次抓取网站并刷新索引前,网页快照仍然会包含原有的内容。因而这些内容仍然会出现在搜索结果中,您可以申请更新快照(http://fankui.help.sogou.com/index.php/web/web/index?type=2)来告知搜狗更新快照信息。

Public @ 2011-01-27 15:34:27

为什么百度快照直接跳到了网站页面?而没快照!

回答:通常产生这种问题的大概率原因是:网站整体更新的非常慢造成的,百度没有对页面进行‘快照’的缓存,只保存了基础的链接信息!其次,网站如果加了禁止缓存的代码,也会出现这个问题!可以联系A5这里帮忙查看哟!

Public @ 2015-06-02 15:34:29

更多您感兴趣的搜索

0.414679s