Categories


Tags


百度的致命抓取异常?你重视过吗?

在这些年的SEO诊断中,我这里发现不低于20%的网站都存在着一个严重的抓取问题,但是奇怪的是,却始终得不到大多数人的重视。而研究透彻并分享这个问题的人,更是没有发现。今天这篇文章,我们就来看一下这个问题。

什么问题呢?

百度的致命抓取异常?你重视过吗? 站长 SEO 网站 建站教程 第1张

连接超时,或者抓取超时,如果你的网站出现过这个问题,至今没有处理到位的,就把这篇文章转载一下吧。

很多人说,不就是几十次的超时吗?有什么大不了的,如果这样认为,那么真的是活该网站做不好了,正常的网站是什么样的呢?我们来举个例子:

百度的致命抓取异常?你重视过吗? 站长 SEO 网站 建站教程 第2张

这是一个权重4的站点,哪怕十多万次的抓取,却仍旧没有出现过一次的抓取错误!如果你的每日抓取错误量超过10次(十天半个月就出现一次错误,或者连续多天出现的),就真的应该严肃处理一下这个问题了,因为当前问题的存在,已经长期的制约了网站的发展上限,甚至因为这个问题,诱发网站的降权,都一点不奇怪。

为什么会出错?

有人说,不用理会,这就是一个BUG,因为我在网站的LOG日志中,并没有发现这个问题。之前在百度站长的VIP群里,有人这样解释过。但是我想说的是:百度无法抓取到网站,你的网站LOG日志,能统计到这样的错误吗?所以,上述解释是完全说不过去的。

那么,为什么会出现这样的错误呢?

A,DNS问题,无论是蜘蛛还是用户访问网站,首先就需要域名的DNS做了正确的解析,然而解析是解析了,你能确定DNS真的稳定吗?不少站点的错误,正是因为DNS不稳定而造成的。尤其是那些又做域名注册,又搞‘域名抢注’的平台,这样的平台,更容易出现DNS解析不稳定的情况,尤其是在抢注高峰期。具体哪些品牌,这个就不点名了,如果你的域名在这些平台中,贺贵江强烈建议你将其转出。

B,页面太大,有一些网站的部分页面达到了四五六七八兆的情况,甚至还见过极少的网站出现过一个页面有10MB大小。这样的页面,更容易出现链接超时。正常情况,并不建议网站的页面大小超过3MB,同时建议网站服务器启用GZIP压缩。

C,带宽不足,这是一个很常见的情况,不少站点出现链接超时都是因为带宽不足而引发的。我们知道1M的带宽峰值下载是128KB,如果网站是1M接入,页面大小是256KB,如果同时2个人在打开页面,那么就需要4秒才可以下载完毕。如果带宽是2MB,页面大小是1024KB,一个人打开网站需要8秒,可如果是10个人同时打开呢?所以带宽这里,一定要做足。站长或者企业都应当观察一下站点的平均带宽,以及峰值带宽情况,如果经常出现‘带宽峰值’类型的访问,那么就一定要升级带宽了。

D,首字节时间,可能很多同学没有听说过这个问题,它指的是从发送请求到WEB服务器的时间+WEB服务器处理请求并生成响应花费的时间。有一些站点,首字节时间居然都可以达到5MS,这样的情况,网站还能正常吗?

1、对于首字节时间这里,我们应当注意:避免网站与其他网站共享同一个服务器其他网站会占用自身网站服务器处理时间。

2、CDN减少内容和访问者之间的“距离”将静态内容分发到CDN,CDN的内容自动复制到各个位置,在地理上更接近用户,从而减少TTFB的时间。注意的是,已定要设置‘缓存时间’针对于网站访问较慢的页面或栏目。

3、避免网站使用虚拟主机系统如网站在一段时间未有流量产生,系统会推迟或暂停虚拟服务器,当新访客进入时,将重新进行服务器备份处理(10s或更长时间);

4、后端优化软件性能减少服务器生成的响应到浏览器的时间,比如:操作码缓存、服务器端缓存、本地缓存、W3总缓存等。

最后,我们总结一下:

首先是为网站找一家靠谱的DNS服务商,我们建议是阿里云,其次是稳定的CDN服务商,阿里、百度智能云、腾讯云,都可以。最后就是网站服务器,尽量不要选择使用虚拟主机,且尽量避免多个站点使用相同服务器。

作者:贺贵江 微信:2567173

来源:卢松松博客


Public @ 2009-05-24 15:32:20

知名站点SEO注意事项

知名站点,是指已经有较高用户知名度的网站。站点越是知名,就越应从长远考虑,以用户体验为重,积极、合理的进行网站优化,远离作弊和恶意SEO行为。我们经常可以看到一些知名站点使用了不够合理的内容建设方式,比如:大量不同内容的页面均使用同一标题。通过图片的方式展现网页中的重要信息(新闻、联系电话等)。重要页面通过flash建设,未使用文字说明。类似的方式,都会使搜索引擎对网站内容的理解造成困难,最终影响

Public @ 2011-01-22 15:30:04

网站日志分析能反馈什么?

一个seo工作人员,特别是那些大型网站的seo人员来说,能独立分析网站日志是一种必不可少的技能,因为大型的网站栏目结构以及页面非常的繁杂,蜘蛛也是少不了会频繁访问,从蜘蛛给网站留下的一些痕迹上面能够掌控网站不少的信息,这对网站优化运营是一种非常必要的参考,前面小星星的文章里面也对蜘蛛状态码也进行了初步的介绍,这篇文章也对网站日志能读取到的信息作出了总结:分析网站日志能获取到的信息总结:一、可以看出

Public @ 2010-01-05 15:32:50

优秀SEO诊断书分享——杨潇波

上周我们分享了在SEO诊断师招募活动中通过审核的吕虎军SEO诊断书,今天给大家分享的是另一位擅长项目管理的、咨道策划创始人杨潇波先生的诊断书,虽然该诊断书完成于2013年,有些内容在2015年看稍显过时,但丝毫不妨碍体现杨潇波的实力,我们期待他为第二届蝶变行动获奖站点做出最漂亮的SEO诊断书。评委zero的点评:相对于其它诊断书,该诊断整体上由数据到具体执行,最后再论长期方向,这样的方案逻辑尤值得

Public @ 2019-05-23 15:30:22

以SEO为目的的行业分析,需要考察哪些方面呢?

看排在前20名的竞争对手页面优化情况如何?是否经过了SEO优化处理?在网页上还是能够体现出来的。有很多页面一看就知道是纯粹的设计师做的,对SEO完全没有了解。诸如网页标题全一个样,URL中带大量参数等等。所以要查看一下你的目标关键词排在前面10-20名的网站是否有优化的痕迹?优化的水平怎么样?看页面中H1的使用,网页文字中关键词的布局,网站栏目的布局,内部链接的安排和流动,应该可以大概了解对手是否

Public @ 2017-01-13 15:30:23

更多您感兴趣的搜索

0.419919s