Categories


Tags


浅谈404问题

今天为什么要说一下404问题呢,最近看case过程中发现个很有意思的网站,该网站被灌了大量的垃圾信息,被其发现后及时地进行了删除,这一点是值得肯定的。通常情况下,正常网站将自动返回404状态码,搜索引擎进行更新并删除,避免对网站用户及搜索引擎带来负面影响。但问题来了,该网站只删除了内容,没有任何主体内容的页面被保存了下来,未做404处理。当然,存在一类网站只删除内容后返回正常200状态码,提醒一句“该内容已删除”,但其都没有。可以发现目前这个搜藏中的url仍然正常返回200,http://cang.baidu.com/Lee/snap/3b0a0cc8e7d7899facd36fad.html,造成的后果:搜索引擎将花费大量的资源在这种无效页面上,那么,同等耗损下用在重要页面上的资源将被大量挤占,可想而知,正常优质页面在搜索引擎的部分表现将受到影响。经过我们运营同学的多方沟通下至今仍未进一步处理。我觉得,21世纪第二个十年了,这种问题不应该再存在了的。

好吧,承认我被打败了。简单说一下:

404状态码代表‘Not Found’,spider更新时会认为该页面已失效,此时呢将在索引库中删除,短期内spider再次发现该url不再会抓取。因此,出来了两类问题:第一,网页临时性打不开;第二,页面永远无法打开。针对第一类问题,我建议不要立刻返回404,而是使用503。503等同于告诉spider该页面临时访问不了,过段时间再来光临。关于503,spider会认为该网页临时无法访问,短期内会再光临。如果网页已经恢复,即刻正常抓取;如果继续返回503,短期内还会再光临几次,但如果该页面长时间返回503,该url仍会被认作失效链接,从索引库中删除。针对第二类问题,永远无法打开的页面,404,不用考虑。各种web2类页面删除后同样需要返回404告知搜索引擎该页面已失效。

回归之前那个网站,删除内容后该页面没有任何价值。最恰当的处理是:

1、直接做死链处理并返回404;

2、在百度站长平台死链提交工具中提交死链sitemap。

最后呢,提醒一下各位站长朋友,当您的网站存在被发布大量垃圾信息时,请:

1、及时删除相关垃圾页面,并做404处理;

2、制作符合要求的死链sitemap;

3、登录百度站长平台,进入死链提交工具提交死链sitemap。

如果大家对404问题还有别的疑问,大家可以到[学堂同学汇][学习讨论]《浅谈404问题》讨论贴中发表自己的看法,我们的工作人员会关注这里并与大家进行探讨。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-09-24 16:09:54

URL是什么?URL里包含关键词对收录有帮助吗?

URL是什么URL是统一资源定位符,对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它URL结构由两部分组成,第一部分是协议,就是大家在网址前边看到的一串字母,最常见的就是HTTP和HTTps,一般在下图所示的位置。第二部分就是大家最常见的服务器名称或者IP地址,通俗点来说

Public @ 2013-12-29 16:11:13

什么是移动Sitemap协议,如何提交移动Sitemap协议

移动Sitemap协议是一种用于向搜索引擎提交移动网站页面信息的协议。它类似于普通的Sitemap协议,但是专门针对移动网站页面优化而设计。 可以通过以下步骤来提交移动Sitemap协议: 1、创建移动Sitemap文件:根据搜索引擎要求,创建包含移动网站页面信息的Sitemap文件。 2、将Sitemap文件上传到网站服务器中。 3、将Sitemap文件的URL提交给搜索引擎:访问搜索引

Public @ 2023-06-02 08:50:11

Apache IIS/.net 制作404页面

Apache服务器上创建404页面: 1. 创建一个新文本文件,命名为404.html(注意,扩展名必须为html)。 2. 打开这个文件,并添加如下代码: 404页面不在这里 抱歉,您正在寻找的页面不在这里 请尝试检查您输入的URL或联系网站管理员。 3. 保存文件并将其上传到您的网站根目录下的相

Public @ 2023-04-17 19:50:47

虚拟主机怎么设置404页面?

要设置虚拟主机的404页面,可以按照以下步骤进行操作: 1. 打开虚拟主机管理面板,在菜单栏中找到“错误页面”或者“定制错误页面”等设置选项。 2. 找到404错误页面设置选项,通常可以选择使用默认的404错误页面或者自定义404错误页面。 3. 如果选择使用默认的404错误页面,则无需做任何设置即可使用。 4. 如果选择自定义404错误页面,则需要新建一个404.html或者404.ph

Public @ 2023-03-31 22:50:29

更多您感兴趣的搜索

0.432057s