Categories


Tags


页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下:

http://www.bianzhihui.com/t/6717(教程详细页面举例)

http://www.bianzhihui.com/u/12306 (用户页面举例)

http://www.bianzhihui.com/h/154 (编织花样页面举例)

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查

工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

【院长帮帮忙】第二期:服务器限制外网访问造成主动推送失败

【院长帮帮忙】第三期:无效搜索结果页是个祸害

【院长帮帮忙】第四期:URL构成越简单越平常越好

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-01-01 15:22:05

如何预防和检测网页挂马?

预防: 1.及时更新操作系统和浏览器的安全补丁和更新。 2.安装并及时更新杀毒软件和防火墙等安全工具。 3.不随意下载和安装不明来源的软件。 4.不轻易打开陌生邮件或者附件。 5.避免点击不明来源的链接和网站。 检测: 1.使用安全工具对电脑系统和浏览器进行全面的扫描。 2.使用一些网站安全检测工具来检测网站的安全性。 3.观察浏览器加载网页时的情况,如果发现加载速度过慢、弹窗频

Public @ 2023-05-30 03:50:13

【院长帮帮忙】资讯页不收录,原来是抢发惹的祸(第四期)

尊敬的用户,您好! 根据您提供的信息,您似乎遇到了一些关于资讯页不收录的问题。根据您所描述的情况,问题可能是由于抢发引起的。在这种情况下,我建议您采取以下几个步骤来解决问题: 1. 静下心来进行审视:首先,您需要仔细审视您的资讯页内容。确保内容的质量和独特性,以及与网站的相关性。如果您的内容不符合这些标准,可能会导致资讯页不被收录。 2. 优化资讯页:进行一些基本的优化措施,如合理使用关键词

Public @ 2023-07-27 13:00:31

服务器限制外网访问造成主动推送失败

《院长帮帮忙》栏目开始运营以后受到了广大站长欢迎,院长每天都会收到各种问题求助。为了更多站长获得收益,我们从中选取了最具有代表性的问题展现给大家。项目背景:和讯网参加星火计划2.0内测,按照站长平台主动提交技术说明代码,共提交两次,均返回报错。下面我们分享下整个case的排查过程:一、提交执行过程首先,按照链接主动提交的技术标准进行提交,具体内容参照《主动链接提交》。1、第一次提交代码curl -

Public @ 2010-01-13 15:22:08

【院长帮帮忙】站点打不开,可能是referer设置问题!(第六期)

站点反馈,在移动搜索下站点被百度屏蔽了经查站点在PC端打开无影响,仅移动端无法打开,且落地页体验、内容均良好,站点并不是被百度屏蔽,而是站点M端的Referer值太长,导致网站打不开(Referer长度不能超过256,超过以后抓取结果为404)站点referer值referer值长度要求各位站长们记住了哦,如遇以上这种情况,被百度屏蔽的锅,我们可不背哦!来源:百度搜索资源平台 百度搜索学堂

Public @ 2022-06-28 15:22:06

更多您感兴趣的搜索

0.437416s