Categories


Tags


【院长帮帮忙】页面无用时间信息导致网页不被爬虫抓取(第一期)

在【院长帮帮忙】栏目露过面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!

站点求助:现象

编织汇网站内容发布后几个礼拜都未曾收录。案例如下:

http://www.bianzhihui.com/t/6717(教程详细页面举例)

http://www.bianzhihui.com/u/12306 (用户页面举例)

http://www.bianzhihui.com/h/154 (编织花样页面举例)

我们已将这些url放入sitemap,并使用了百度统计的集成的JS推荐,但是未曾有改善。

站点求助:自查

根据反馈中心的回复,使用抓取异常工具诊断:未发现异常

院长出手,内部追查

工程师结论: spider抓取很及时,但因为该网站没有设置内容产出时间,网站底部却有个老旧时间日期,导致spider误以为网页内容老旧(具体策略较复杂,在此不做赘述)。建议增加页面内容产生时间,去掉没有必要的时间信息

*以上为旧页面截图,“2014年9月9日”对时间识别造成干扰。

站点总结:

1,网页上切忌勿乱加时间,如我们网站的(始于2014年9月9日)这种时间是一个大忌

2,网页内容尽可能加上产出时间,也就是发布时间

3,百度site的结果时间和权重并无太多关系

4,跟百度沟通的时候,一定要条例清晰,证据确凿。自身的问题一定要先排查准确。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2015-07-21 15:22:04

百度Spider渲染UA在移动端全流量上线

百度Spider在2017年3月同时推出渲染UA在移动端和PC端进行内测(《百度Spider新增渲染UA抓取公告》),内测期间分析了多个抓取量异常的case,均非渲染UA造成。本周百度Spider渲染UA在移动端全流量上线,PC端还未全部覆盖。特提醒PC站长,截止目前,对搜索引擎和用户有价值的内容,还是尽量不要使用JS加载的方式,以免造成不能索引等损失。来源:百度搜索资源平台

Public @ 2014-04-27 15:38:47

百度真假蜘蛛IP如何识别?判断百度蜘蛛的鉴别方法

很多SEO从业人员在刚刚接触这个行业的时候,经常会问——百度蜘蛛是什么?我们可以理解为百度蜘蛛就是用来抓取网站链接的IP,小编经常会听到百度蜘蛛来的太频繁,服务器要被抓爆了,如果你无法识别百度蜘蛛,你怎么知道是百度蜘蛛抓爆的呢?也有出现百度蜘蛛都不来了的情况,还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但无法识别百度IP。那怎么才能识别正确的百度蜘蛛呢?来来来,只需做着两点,就能正确识

Public @ 2010-10-11 16:22:32

【院长帮帮忙】我的网站排名为什么突然下降?(第十期)

近期,院长收到许多站长的反馈,说自己运营的站点排名突然下降。有站长对照近期公布的细雨算法分析,认为是细雨算法的惩罚生效,影响了网站的流量。但情况真的是这样吗?现在就让院长来给你个说法吧!院长对近期反馈的case集中进行了分析,从反馈的问题来看,问题多集中在网站标题作弊,明确的说,是网站页面标题堆砌的行为导致的。自2017年9月起,百度搜索资源平台发布了清风算法、清风算法2.0 ,主要是针对标题作弊

Public @ 2021-03-04 15:22:02

【院长帮帮忙】网站被黑,到底是谁的责任?(第九期)

很多网站会突然找院长反馈,说网站突然出现了很多奇怪的页面,虽然域名是自己网站的,但是内容都不是网站发布的,而且一般都是赌博等内容;或者还有站长反馈,百度抓了自己网站的好多内容,而且这些内容都是博彩内容,但是网站并没有这些啊,百度出什么问题了?要求百度尽快处理问题!关于以上的这些问题,曲曲小姐姐再次给大家强调一下。如果网站突然出现大量的赌博等内容,这是网站被黑了啊,这肯定是网站自己的问题引起的,也只

Public @ 2014-01-07 15:22:07

更多您感兴趣的搜索

0.478059s