Categories


Tags


503状态码:防止网页被删除

我认为503状态码最大的作用是告知搜索引擎:现在服务器压力过大,网站(某个网页)稍后再抓取,503是指目前无法使用服务器(由于超载或进行停机维护)。通常,这只是一种暂时的状态。按照百度的说法,网站关闭或其他临时情况,这个时候网站应该返回:“503 Service Temporarily Unavailable”!使用503状态码,而不是404错误页面。

如果网站需要临时维护或者未建立好就上线的页面,当网页不能打开时以及没有建好时,不要立即返回404,建议使用503状态。503可以告知百度spider该页面临时不可访问,请过段时间再重试。

503状态码:防止网页被删除 SEO优化 主机 SEO推广 第1张

(网页出现503状态提示)

如果返回404状态码,会被百度当成死链删除,造成收录和流量损失。使用503返回码,这样百度的抓取器接到503返回码后,会在隔一段时间再去访问这个地址,在您的页面建好上线后,就又能被重新抓取,保证页面及时被抓取和索引,避免未建好的内容设为404后带来不必要的收录和流量损失。

常见的HTTP状态码

404:404返回码的含义是“NOT FOUND”,百度会认为网页已经失效,那么通常会从搜索结果中删除,并且短期内spider再次发现这条url也不会抓取。

301:301返回码的含义是“Moved Permanently”,百度会认为网页当前跳转至新url。当遇到站点迁移,域名更换、站点改版的情况时,推荐使用301返回码,尽量减少改版带来的流量损失。虽然百度spider现在对301跳转的响应周期较长,但我们还是推荐大家这么做。

503:503返回码的含义是“Service Unavailable”,百度会认为该网页临时不可访问,通常网站临时关闭,带宽有限等会产生这种情况。对于网页返回503,百度spider不会把这条url直接删除,短期内会再访问。届时如果网页已恢复,则正常抓取;如果继续返回503,短期内还会反复访问几次。但是如果网页长期返回503,那么这个url仍会被百度认为是失效链接,从搜索结果中删除。

503状态码的设置方法

IIS服务器的就好解决,一般回收一下应用程序池即可,或者重启一下IIS。

下面举的例子需要配合APACHE的 .htaccess 重写文件来实现:

Options +FollowSymLinks

RewriteEngine On

RewriteBase /

RewriteCond %{HTTP_USER_AGENT} ^.*Google.* [NC]

RewriteRule .* /cgi-bin/error/503.php

向除了指定ip外的任何来访者发送 503:

Options +FollowSymLinks

RewriteEngine On

RewriteBase /

RewriteCond %{REMOTE_HOST} !^1\.1\.1\.1

RewriteCond %{REQUEST_URI} !^/cgi-bin/error/503\.php [NC]

RewriteRule .* /cgi-bin/error/503.php

向蜘蛛发送 503,其他来访者返回一个 404 页面:

Options +FollowSymLinks

RewriteEngine On

RewriteBase /

RewriteCond %{HTTP_USER_AGENT} ^.*(Googlebot|Googlebot|Mediapartners|Adsbot|Feedfetcher)-?(Google|Image)? [NC]

RewriteCond %{REQUEST_URI} !^/cgi-bin/error/503\.php [NC]

RewriteRule .* /cgi-bin/error/503.php

RewriteCond %{REMOTE_HOST} !^1\.1\.1\.1

RewriteCond %{REQUEST_URI} !^/cgi-bin/error/404\.php [NC]

RewriteRule .* /under-development-explain.html [R=302,L]

如果是单页面,可以先建一个503.php文件,

<?php

ob_start();

header('HTTP/1.1 503 Service Temporarily Unavailable');

header('Status: 503 Service Temporarily Unavailable');

header('Retry-After: 3600');

header('X-Powered-By:');

?><!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">

<html><head>

<title>503 Service Temporarily Unavailable</title>

</head><body>

<h1>Service Temporarily Unavailable</h1>

<p>The server is temporarily unable to service your

request due to maintenance downtime or capacity

problems. Please try again later.</p>

</body></html>

把这段代码复制进去就可以了,但切记把所有页面都指向这一个页面,这样做只告知了用户,而没有通知蜘蛛,这样蜘蛛只会以为其他页面被删除了,只剩下这个页面。

第一二句告知搜索蜘蛛网站处理暂时关闭状态,第三句告知搜索蜘蛛,网站将于2012年10月8日18:27从新开放,注意:这里用的是格林威治标准时间。

但是光放一个503信息到服务器里还是不够的,蜘蛛会访问网站不同的页面,因此我们必须引导所有的蜘蛛到503.php这个页面,让蜘蛛知道,整个网站处于临时关闭中,而不是个别页面。

如果站长使用的是Apache/Linux服务器,我们只需在.htaccess设置一下,引导所有的蜘蛛到505.php页面,这里我们要使用302跳转,注意:在这里千万不要使用301跳转,因为301是永久的,在这种情况下会毁灭掉整个网站。

引导蜘蛛到503.php

将下面这段代码保存到.htaccess文件,并上传到网站根目录

Options +FollowSymLinks

RewriteEngine On

RewriteBase /

RewriteCond %{REMOTE_ADDR} !^00\.00\.00.\.00

RewriteCond %{REQUEST_URI}!^/503.php [NC]

RewriteRule ,* /503.php [R,L]

最后一行的[R, 告知蜘蛛,这个是302跳转,属于暂时的。这样我们就完成了网站临时关闭的部署,可以放心关站了!

百度站长平台的建议和总结:

如果百度spider对您的站点抓取压力过大,请尽量不要使用404,同样建议返回503。这样百度spider会过段时间再来尝试抓取这个链接,如果那个时间站点空闲,那它就会被成功抓取了

如果站点临时关闭或者页面暂未建好上线,当网页不能打开时以及没有建好时,不要立即返回404,建议使用503状态。503可以告知百度spider该页面临时不可访问,请过段时间再重试。

注:部分内容引自网络和百度站长平台

来源:卢松松博客


Public @ 2012-10-05 15:35:43

网站被站内恶意搜索和各种攻击

亲身经历,网站被DDOS,恶意搜索,尝试破解登录等等,最终加安全防护,CDN,直至解决,其实我对安全防护也是不太懂,期间不断摸索找解决办法,最终算是解决掉了。与大家分享下这次经历,很多不专业的地方大家指正交流。普通站长一个,从2014年开始做了自己的博客网站,做为爱好,一直断断续续的维护。因为工作忙,大概有大半年没有维护自己的网站,6月底突然发现自己的网站访问不了了,带宽耗尽,我的空间80G的流量

Public @ 2021-02-28 15:37:56

杀死你网站SEO的5个技术

几天前,胡亮亮先生(网迈SEO总监)在其微信公众帐号里发布了文章《杀死你网站SEO的5个技术》,当时感觉内容挺好可是个别地方写得不够清晰完善,于是小编主动联系作者进行了沟通,胡亮亮收到反馈后很快整理出完整版,学堂终于可以发出来给大家分享一下了:应百度站长平台邀请,抽空把这篇文章做一些细节上的补充 ,欢迎大家关注并讨论。由于现阶段,触屏技术以及移动互联网的发展,SEO也面临着各种各样的算法变革,技术

Public @ 2009-10-13 15:27:32

如何查询域名或链接的http状态码

要查询一个域名或链接的HTTP状态码,可以使用网络工具或编程语言中的相关功能来完成。以下是一种常见的查询方法: 1. 使用网络工具: - 使用浏览器:在浏览器的地址栏中输入要查询的域名或链接,按下回车键。然后,在开发者工具的“网络”选项卡中可以看到所有的请求和响应,其中包括HTTP状态码。 - 使用命令行工具:例如,在Windows上可以使用curl命令: `curl -I `。该命

Public @ 2023-07-28 13:00:41

站长常见HTTP状态码及解决方案

HTTP状态码是用以表示网页服务器HTTP响应状态的3位数字代码。各位站长在平时维护网站过程中,可能会在站长工具后台抓取异常里面或者服务器日志里看到各种各样的响应状态码,有些甚至会影响网站的SEO效果,下面百度工程师为大家整理了一些常见的HTTP状态码及处理解决的方法:301:(永久移动)请求的网页已被永久移动到新位置。服务器返回此响应(作为对GET或HEAD请求的响应)时,会自动将请求者转到新位

Public @ 2010-07-19 15:35:41

更多您感兴趣的搜索

0.420082s