Categories


Tags


网站误封Robots该如何处理

robots文件是搜索生态中很重要的一个环节,同时也是一个很细节的环节。很多站长同学在网站运营过程中,很容易忽视robots文件的存在,进行错误覆盖或者全部封禁robots,造成不必要损失!

那么如果误操作封禁了robots怎么办?今天我们请到了厦门258网站运营负责人——郑军伟,为我们分享网站robots误封禁后该如何操作?

【案例背景】

网站开发2.0版本,技术选择了在线开发,为了避免搜索引擎抓取开发版本,要求技术人员设置了Robots封禁处理。2.0版本开发周期1个月,1个月后网站版本迭代,直接覆盖了1.0版本,包括Robots封禁文件,2天后发现流量大幅下降,检查收录发现800万收录降至0条,关键词大量掉线。

【处理方式】

1.修改Robots封禁为允许,然后到百度搜索资源后台检测并更新Robots。

2.在百度搜索资源后台抓取检测,此时显示抓取失败,没关系,多点击抓取几次,触发蜘蛛抓取站点。

3.在百度搜索资源后台抓取频次,申请抓取频次上调。

4.百度反馈中心,反馈是因为误操作导致了这种情况的发生。

5.百度搜索资源后台链接提交处,设置数据API推送(实时)。

6.更新sitemap网站地图,重新提交百度,每天手动提交一次。

以上处理完,接下来就是等待了,万幸,2天的时间数据开始慢慢回升,到第3天基本回升到正常状态!

【案例总结】

本次事故绝对是运营生涯的一次败笔,总结反思一下,希望大家避免类似问题。

1.产品开发一定要避免在线开发,不能为了省事不搭建开发环境。

2.产品迭代要有流程记录,开发时做了那些设置处理,那些是不需要放出来的,那些是必须放出来的,要非常清楚。

3.要经常关注百度搜索资源后台,关注相关数据变化,从数据变化中及时发现问题

百度搜索robots协议全新升级

9月11日,百度搜索robots全新升级。升级后robots将优化对网站视频URL收录抓取情况。仅当您的网站包含不希望被视频搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

如您的网站未设置robots协议,百度搜索对网站视频URL的收录将包含视频播放页URL,及页面中的视频文件、视频周边文本等信息,搜索对已收录的短视频资源将对用户呈现为视频极速体验页。此外,综艺影视类长视频,搜索引擎仅收录页面URL。

详情见:视频极速体验解决方案

来源:百度搜索资源平台 百度搜索学堂


Public @ 2009-10-29 16:08:56

什么是首选域设置

网站在做优化的时候有一个专业术语叫首选域,这个专业术语在很多SEO培训机构或者SEO行业前辈经验分享中都有提到过。那究竟什么是首选域的作用,网站如何设置首选域  什么是首选域呢?  网站的首选域类似于标准化URL,是搜索引擎索引中编制网页的域。在搜索引擎搜索结果中,指向网站的链接有www和非www网址格式。而所谓的首选域是我们希望网站在搜索结果中显示的格式。  一般情况下,搜索引擎认为域名带www

Public @ 2021-09-10 16:21:37

Sitemap协议类型及包含范围

Sitemap协议是一种用于向搜索引擎提供网站结构信息的标准协议。其包含的内容包括网站中所有页面的URL、页面最后更新时间、页面更新频率等信息。 目前,Sitemap协议一共有以下两种类型: 1. XML Sitemap:用于描述网站的全部网页,包括网页的URL、标识、访问频率、权重等信息。XML Sitemap可以包含多个XML文件,但每个XML文件的大小不能超过50MB。 2. HTML

Public @ 2023-04-18 11:50:23

robots里这样写,就能避免蜘蛛爬这个“index.htm”这个首页?

我robots这样写是不是就能避免蜘蛛爬这个“index.htm”这个首页?User-agent: *Disallow: /index.htm11-30.我的index.htm是现在默认的首页,想屏蔽蜘蛛抓取。让蜘蛛爬另一个文档,主要是规避备案巡查我的网站和我备案的不一样,服务器那边要求改,我就整了个htm文档来规避下。写法没有问题。但正常的不建议屏蔽首页地址,,“index.htm”这个后缀地址

Public @ 2019-12-16 16:09:25

robots里这样写,就能避免蜘蛛爬这个“index.htm”这个首页?

要避免搜索引擎蜘蛛爬取某个页面,可以在robots.txt文件中添加如下指令: User-agent: * Disallow: /index.htm 这样,所有搜索引擎蜘蛛都不会爬取网站的index.htm首页页面。注意,这并不代表该页面会从搜索结果中彻底移除,因为即使没有被索引,用户仍然可以在搜索结果中找到该页面。

Public @ 2023-06-09 00:50:07

更多您感兴趣的搜索

0.596345s