Categories


Tags


百度搜索资源平台-平台工具使用手册-抓取异常

1、网站验证

2、普通收录

3、快速收录

4、死链提交

5、网站改版

6、索引量

7、流量与关键词

8、抓取异常

9、抓取诊断

10、抓取频次

11、robots

12、反馈中心

13、站点子链

14、移动适配

15、分润中心

16、站点属性

什么是抓取异常

Baiduspider无法正常抓取,就是抓取异常。

抓取异常对网站有哪些影响

对于大量内容无法正常抓取的网站,搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、权重上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

抓取异常的原因有哪些

一、网站异常

1、dns异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

2、连接超时

抓取请求连接超时,可能原因服务器过载,网络不稳定

3、抓取超时

抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足

4、连接错误

无法连接或者连接建立后对方服务器拒绝

二、链接异常

1、访问被拒绝

爬虫发起抓取,httpcode返回码是403

2、找不到页面

爬虫发起抓取,httpcode返回码是404

3、服务器错误

爬虫发起抓取,httpcode返回码是5XX

4、其他错误

爬虫发起抓取,httpcode返回码是4XX,不包括403和404

来源:百度搜索资源平台 百度搜索学堂


Public @ 2016-02-22 16:02:41

robots封禁后,为什么线上结果没有立刻消除或百度爬虫依旧对封禁目录进行抓取?

您好,网站在设置robots封禁,您可以使用搜索资源平台的robots工具进行更新,更新后可以尝试使用抓取诊断工具进行检测。 百度在robots封禁后,百度可以保证不再对robots封禁的网站和目录进行抓取,但无法保证线上结果会立即消除,线上更新需要一定周期。如您站想快速删除索引,您可以将域名设置404状态,使用死链工具进行提交。如问题依旧存在,请进行人工反馈。

Public @ 2011-09-19 16:08:16

百度搜索资源平台-抓取频次

使用说明1. 抓取频次是搜索引擎在单位时间内(天级)对网站服务器抓取的总次数,如果搜索引擎对站点的抓取频次过高,很有可能造成服务器不稳定,Baiduspider会根据网站内容更新频率和服务器压力等因素自动调整抓取频次2. Baiduspider会根据网站服务器压力自动进行抓取频次调整3. 建议您慎重调节抓取频次上限值,如果抓取频次过小则会影响Baiduspider对网站的收录来源:百度搜索资源平台

Public @ 2017-12-10 16:06:48

百度搜索资源平台-平台工具使用手册-网站改版

1、网站验证2、普通收录3、快速收录4、死链提交5、网站改版6、索引量7、流量与关键词8、抓取异常9、抓取诊断10、抓取频次11、robots12、反馈中心13、站点子链14、移动适配15、分润中心16、站点属性使用网站改版工具前,站点应该做哪些工作1)首先您要将改版前的旧链接全部通过301跳转到改版后的新链接,并且这种跳转必须是一一对应的关系,不能出现多条旧链接跳转到一条新链接,或者一条旧链接在

Public @ 2018-01-06 16:02:42

更多您感兴趣的搜索

0.474038s