Categories


Tags


搜索问答剧场 【六】“死链”常见问题解析

哈喽大家好,

最近平小雕在观察和学习时,

发现很多开发者都提出了死链方面的问题。

这不我(平小雕)和胡小鱼立马联手找出了大家对死链的种种疑问,并做出了解答,大家快来看看怎么解决死链常见问题吧!

第六集【搜索问答剧场】,让我们围观网站运营中出现的死链相关问题,学习如何快速处理网站死链吧!

一、了解死链

1、死链都有哪些类型?

A:死链一般是指页面已经无效,无法对用户提供任何有价值信息的页面。包括协议死链和内容死链。

(1)协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如403、404、503状态等。

(2)内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。内容死链,服务器端返回HTTP状态码200,无法设置为404。

2、Q:死链是如何产生的?

A:死链可能存在以下来源:

(1)网站内部主动或被动添加了错误内容链接,发现后需要及时做404处理,如网站被恶意添加大量黄反内容等。

(2)网站服务器、空间或程序问题,导致网站短暂无法访问,如服务器不稳定。

(3)外部链接错误,用户或者站长在站外发布了错误URL。

(4)爬虫提取不完整的URL,个别爬虫在提取页面URL时,因为URL中有不规则字符,或者URL与后边的文字链接起来,导致URL失效。

(5)网站改版,网站改版后,之前的老域名页面直接删除,导致了大量的死链接。

3、Q:为什么要及时处理死链 ?不处理是否有影响?

A:(1)死链是页面无效,不能给浏览用户提供任何价值,但增加网站的管理成本。

(2)当网站死链数据累积过多时,且被展示到搜索结果页中时,对网站本身的访问体验和造成负面影响。

(3)百度蜘蛛会定期检测网站页面内容价值,若存在大量死链,可能会影响网站整体评价,从而不能更好的进行网站抓取和展现。

4、Q:如何发现网站中存在的死链接?

A:(1)搜索资源平台工具:抓取异常工具可以查看最近产生的死链,且支持导出功能。

(2)参考爬虫软件:此类工具可以爬取全站所有链接并分析页面状态,分析完成后,支持导出功能,提取死链接即可。

二、教你如何处理死链页面

1、Q:如何有效处理死链?

A:死链资源的更新,不同网站可能会存在不同周期。为保障及时更新死链,可以通过资源平台-【死链提交】工具,进行提交。

2、Q:如何使用平台工具处理死链?

A:使用【死链提交】工具有效的提交死链,需要以下步骤:

第一步:处理的页面设置404页面

将需处理的页面设置404页面,生成死链文件整理被黑、无效等需要被删除的资源,页面设置404,一定是404页面。

将需提交的404页面列表制作成一个待提交的文件,制作方法请参阅帮助文档:

(与sitemap格式及制作方法一致)

第二步:将文件放置在网站根目录下

将死链文件放置在网站根目录下,比如您的网站为example.com,您已制作了一个silian_ example.xml死链文件,则将silian_example.xml上传至网站根目录即example.com/silian_ example.xml。

第三步:登录百度搜索资源平台

登录搜索资源平台,找到【死链提交】工具。(若未站点验证,需要先完成站点验证,之后使用工具提交文件)。

第四步:提交死链数据

(1)【资源提交】-【死链提交】工具中提交死链文件。

(2)提交完成后,关注死链文件处理状态。

三、使用【死链提交】工具的注意事项

1、【死链提交】工具可以识别403、500等无效数据吗?

A:不可以,【死链提交】工具仅识别404,请一定设置为404;若存在非404资源,可能会影响整个文件生效情况。

注:请勿使用该工具提交非死链内容,避免影响正常页面的搜索展现效果。

2、【死链提交】工具是否可以删除目录下所有链接(如:*.a.example.com)?

A:不支持目录级提交,只能提交具体需要删除的链接 。

3、工具支持索引型sitemap文件吗?

A:不支持,请勿提交索引型文件。

4、提交数据的生效周期是什么?

A:死链提交后一般生效周期为1-2周。

来源:百度搜索资源平台


Public @ 2012-12-31 15:36:48

网站质量指南

网站质量指南是一份指导网站制作和维护的准则,旨在帮助开发者和运营者创建高质量、用户友好的网站。以下是一些常见的网站质量指南: 1. 用户友好性:网站应该易于导航,页面加载速度快,具有优秀的响应性,并且要提供清晰的内容布局和易于理解的导航结构。 2. 内容质量:网站应该提供有价值、有用、原创的内容,并且要避免任何形式的抄袭和重复内容。 3. 安全性:网站应该具备一定的安全性,如使用HTTPS协议保

Public @ 2023-07-21 16:50:44

503状态码:防止网页被删除

503状态码表示服务器暂时无法处理请求,常见的原因有服务器过载、维护或升级等。与防止网页被删除的关系不太直接,但可以理解为服务器因某种原因暂时无法提供网页内容,因此用户无法访问网页。通常情况下,当服务器恢复正常后,状态码会变为200或其他合适的状态码,用户就可以正常访问网页了。

Public @ 2023-07-30 18:50:09

及时处理死链可以给站长带来什么

当网站死链数据累积过多时,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引。优化用户体验:减少死链对网站品牌的损伤和用户的差评度改善网站排名:减少死链对线上搜索排名的负面影响增加网站收录:提交死链列表后,增加网站内容的收录几率提升网站流量:排名和收录改善后,间接提升网站流量来源:百度搜索资

Public @ 2014-04-28 15:36:50

百度搜索建议的死链设置方案

第一步,将返回码设置为404或者410:如果站点/小程序已永久删除相应内容,并且不打算对内容进行替换,建议开发者将返回码设置成404或410,百度爬虫尝试抓取网页时,如果返回码为404或410,会将URL判定为死链,进而从搜索中删除第二步,设置完返回码后,修改页面标题,明确表示该页面为死链,页面内容可以进行个性化设置。对百度搜索不友好的死链类型及不推荐的死链方案:1、个性化死链部分开发者追求个性化

Public @ 2013-12-22 15:36:55

更多您感兴趣的搜索

0.466185s