Categories


Tags


【院长帮帮忙】资讯页不收录,原来是抢发惹的祸(第四期)

里约奥运会结束了,资讯站点的小编们终于可以松口气了,可有些SEOer却高兴不起来:编辑辛苦抢先制作的原创稿件,百度却不!收!录!院长奥运会期间接到了四五起这样的反馈,经追查,原来是站点的抢发行为不够友好,导致spider抓取失败。结论:

1,页面制作完成后再放到spider可以发现的地方,这样才能达到最好的抓取效果。

2,页面未对外公开之前,千万不要通过工具推送给百度呀。

接到站长反馈后,院长联系了spider工程师,工程师在后台查询了这些未收录的链接,发现均显示为“死链”,然而这些所谓的死链现在访问都是好好的。根据后台显示的抓取时间,院长反复和站点进行沟通,终于找到了根源:原来,站点为了抢新闻,提前制作了新闻稿并制作成链接并且发布,虽然没有在首页等重要页面推送给用户,但却被BaiduSpider发现,更重要的是,这些链接向BaiduSpider返回的状态码是404。

举个例子,中国女排进入决赛后,某网站做了A和B两个页面,分别为夺冠和摘银,为了防止用户在比赛结束之前阅读到页面内容,站点将两个链接都设置为404!404!(等到比赛结束后,再将其中一个页面的html返回码改为200)。虽然页面并没有向用户推送,但还是被聪明的BaiduSpider发现。然而这里的问题是,BaiduSpider发现页面是404,又无法判断出这是一个重要页面,于是直接打入冷宫不再理睬。

所以,学堂反复强调,确认页面真的不需要被搜索引擎保留时可以使用404(临时闭站可使用百度站长平台的闭站保护工具),如果还希望和搜索引擎保持友好关系的话,请使用503,防止页面被删除。虽然Baidu有对高价值内容的“删除保护”功能,但毕竟不是每个站点都可以享受到这个特权的。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2009-06-13 15:22:04

网站全站启用HTTPS要如何配置?

为了全站启用HTTPS,需要进行以下配置: 1. 获取SSL证书:从CA机构(认证机构)申请SSL证书。 2. 配置Web服务器:在Web服务器上安装SSL证书,并设置HTTPS监听端口和协议。 3. 配置网站:将网站的URL地址修改为HTTPS,并将页面中的所有资源(CSS、JS、图片等)的URL地址也修改为HTTPS。 4. 强制跳转:使用301重定向,把所有的HTTP请求自动转发到H

Public @ 2023-06-03 02:00:13

站点流量异常追查文档-特征页分析

特征页分析是站点流量异常追查中的一个关键步骤,目的是发现异常流量来源并采取相应的措施。下面是特征页分析的具体步骤: 1. 定义特征页:根据站点的业务特点和用户行为,定义出可能引起异常流量的特征页。例如,注册登录、结算页面、特价促销页面等。 2. 分析流量变化:通过流量监控工具分析特征页的访问量变化,查看是否存在异常的访问峰值或者间歇性的访问流量。 3. 分析来源渠道:针对异常的流量,通过分析

Public @ 2023-04-09 04:01:34

【院长帮帮忙】页面无用时间信息导致网页不被爬虫抓取(第一期)

在【院长帮帮忙】栏目露过面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!站点求助:现象编织汇网站内容发布后几个礼拜都未曾收录。案例如下:http://www.bianzhihui.com/t/6717(教程详细页面举

Public @ 2015-07-21 15:22:04

【院长帮帮忙】流量断崖式下跌,如何自查恢复?(第七期)

院长近期收到一个VIP站点反馈,站点下的所有收录都没有了,站点流量断崖式下跌,先来看看这扎心的图:PC端流量变化:移动流量变化:院长解答:出现这种情况,首先要站长观察流量下滑期间站点是否有异常,并自查以下步骤:1. 网站自查发现自己出现过服务器异常,服务器错误导致页面失效,需尽快恢复站点服务器;这里推荐使用站长平台“抓取异常工具”&“抓取诊断工具”,可整体统计站点近期抓取问题,模拟蜘蛛抓取

Public @ 2014-02-02 15:22:05

更多您感兴趣的搜索

0.426780s