Categories


Tags


【院长帮帮忙】资讯页不收录,原来是抢发惹的祸(第四期)

里约奥运会结束了,资讯站点的小编们终于可以松口气了,可有些SEOer却高兴不起来:编辑辛苦抢先制作的原创稿件,百度却不!收!录!院长奥运会期间接到了四五起这样的反馈,经追查,原来是站点的抢发行为不够友好,导致spider抓取失败。结论:

1,页面制作完成后再放到spider可以发现的地方,这样才能达到最好的抓取效果。

2,页面未对外公开之前,千万不要通过工具推送给百度呀。

接到站长反馈后,院长联系了spider工程师,工程师在后台查询了这些未收录的链接,发现均显示为“死链”,然而这些所谓的死链现在访问都是好好的。根据后台显示的抓取时间,院长反复和站点进行沟通,终于找到了根源:原来,站点为了抢新闻,提前制作了新闻稿并制作成链接并且发布,虽然没有在首页等重要页面推送给用户,但却被BaiduSpider发现,更重要的是,这些链接向BaiduSpider返回的状态码是404。

举个例子,中国女排进入决赛后,某网站做了A和B两个页面,分别为夺冠和摘银,为了防止用户在比赛结束之前阅读到页面内容,站点将两个链接都设置为404!404!(等到比赛结束后,再将其中一个页面的html返回码改为200)。虽然页面并没有向用户推送,但还是被聪明的BaiduSpider发现。然而这里的问题是,BaiduSpider发现页面是404,又无法判断出这是一个重要页面,于是直接打入冷宫不再理睬。

所以,学堂反复强调,确认页面真的不需要被搜索引擎保留时可以使用404(临时闭站可使用百度站长平台的闭站保护工具),如果还希望和搜索引擎保持友好关系的话,请使用503,防止页面被删除。虽然Baidu有对高价值内容的“删除保护”功能,但毕竟不是每个站点都可以享受到这个特权的。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2009-06-13 15:22:04

别样SEO——搜索体验优化全解

什么是搜索体验优化? 搜索体验优化(Search Experience Optimization,简称SEO),是一种旨在优化用户在搜索引擎中的搜索体验的策略。 在过去,SEO主要关注的是排名,也就是帮助网站排名在搜索引擎获得更高的可见度。然而,随着搜索引擎算法的智能化,搜索体验优化变得更为重要。搜索体验优化的目标是优化整个搜索过程,包括搜索的查询、搜索结果、点击和转化,以提供更好的搜索体验。

Public @ 2023-06-06 22:00:32

大型网站的 HTTPS 实践(1):HTTPS 协议和原理

百度在2015年即完成HTTPS改造,那大型网站的HTTPS改造中都有哪些实践经验,学堂君特分析这篇干货满满系列内容,转自百度运维博客。1 前言百度已经于近日上线了全站 HTTPS 的安全搜索,默认会将 HTTP 请求跳转成 HTTPS。本文重点介绍 HTTPS 协议, 并简单介绍部署全站 HTTPS 的意义。2 HTTPS 协议概述HTTPS 可以认为是 HTTP + TLS。HTTP 协议大家

Public @ 2019-06-17 15:22:21

服务器限制外网访问造成主动推送失败

《院长帮帮忙》栏目开始运营以后受到了广大站长欢迎,院长每天都会收到各种问题求助。为了更多站长获得收益,我们从中选取了最具有代表性的问题展现给大家。项目背景:和讯网参加星火计划2.0内测,按照站长平台主动提交技术说明代码,共提交两次,均返回报错。下面我们分享下整个case的排查过程:一、提交执行过程首先,按照链接主动提交的技术标准进行提交,具体内容参照《主动链接提交》。1、第一次提交代码curl -

Public @ 2010-01-13 15:22:08

页面无用时间信息导致网页不被抓取

在第一期【院长帮帮忙】栏目露面的站点是编织汇(www.bianzhihui.com),该站点通过反馈中心反馈页面内容迟迟不被抓取,经百度工程师追查,原来是因为页面上的无用时间信息——没有想到是不是?同学们快来看看这个案例吧。也想让院长帮助追查吗?快来看看这里!站点求助:现象编织汇网站内容发布后几个礼拜都未曾收录。案例如下:http://www.bianzhihui.com/t/6717(教程详细页

Public @ 2014-01-01 15:22:05

更多您感兴趣的搜索

0.423312s