Categories


Tags


抓取异常的原因有哪些

一、网站异常

1、dns异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

2、连接超时

抓取请求连接超时,可能原因服务器过载,网络不稳定

3、抓取超时

抓取请求连接建立后,下载页面速度过慢,导致超时,可能原因服务器过载,带宽不足

4、连接错误

无法连接或者连接建立后对方服务器拒绝

二、链接异常

1、访问被拒绝

爬虫发起抓取,httpcode返回码是403

2、找不到页面

爬虫发起抓取,httpcode返回码是404

3、服务器错误

爬虫发起抓取,httpcode返回码是5XX

4、其他错误

爬虫发起抓取,httpcode返回码是4XX,不包括403和404

来源:百度搜索资源平台 百度搜索学堂


Public @ 2018-09-22 16:02:23

站点referer限制应增加豁免百度https

百度全站https后,发现有站点无法通过部分浏览器下的百度搜索引擎进行访问,如在ie浏览器中可以正常访问(百度referer的协议是http://www.baidu.com),而在chrome浏览器中无法正常访问(百度referer的协议是https://www.baidu.com)。原因是这些站点针对百度https协议头的referer做了限制处理。referer限制:网站为了避免攻击或者防止盗

Public @ 2011-02-24 16:07:11

抓取异常的原因有哪些

一、网站异常1、dns异常当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。2、连接超时抓取请求连接超时,可能原因服务器过载,网络不稳定3、抓取超时抓取请求连接建立后,下载页面速度过慢,

Public @ 2018-09-22 16:02:23

百度搜索资源平台-关于回收违规站点平台权限的通知

为了维护优质站点的权益,营造健康的搜索生态环境,百度搜索资源平台近期将会重点核查存在违规行为和低质内容的站点,对违规站点取消平台验证、回收平台权限,同时对存在严重违规问题的账号进行限制。请广大搜索合作伙伴严格遵守法律法规及搜索算法规范,积极生产符合搜索用户需求的优质内容,共同促进搜索生态良性循环。来源:百度搜索资源平台

Public @ 2017-10-05 16:05:16

百度索引量工具数据恢复公告

尊敬的用户: 我们深感抱歉的通知您,百度索引量工具数据恢复工作由于技术问题未能如期完成。原计划于11月30日,针对10月份的索引量展开数据查询与恢复,但在执行过程中发现了系统bug,需要更多时间来修复。 我们已经调派了专业技术团队全力以赴,争取尽快解决问题。同时,我们也会加强对系统的监测和测试工作,确保这样的问题不再出现。 我们知道这次事故给您带来了很多不便和困扰,但请您相信,我们会不遗余力

Public @ 2023-05-31 19:50:22

更多您感兴趣的搜索

0.468590s