如何使用Robots避免蜘蛛黑洞？_威海佰年网络技术有限公司_网站建设_软件开发_私有云_商标注册_公众号_小程序_APP_物联网

如何使用Robots避免蜘蛛黑洞？

蜘蛛黑洞：

蜘蛛黑洞指的是网站通过极低的成本运营，制造出大量和内容相识但参数不同的动态URL ，像一个无限循环的“黑洞”将蜘蛛困住，蜘蛛花费太多的时间在网站，浪费了大量资源抓取的网页为无效网页。

如果你的网站存在蜘蛛黑洞现象，尽快的处理好，蜘蛛黑洞不利于网站的收录，也会影响搜索引擎对网站的评分。

如何使用Robots避免蜘蛛黑洞？

如何利用Robots避免蜘蛛黑洞操作：

普通的筛选结果页基本都是使用静态链接，比如：

http:// bj.XXXXX. com/category/zizhucan/weigongcun

当用户选择不同排序后，会自动生成带有不同参数的动态链接，即使选择是同一种排序条件，生成的参数也有不同的，比如：

http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek

http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c

把带有不同参数的结果排序页面使用robots规则拒绝，告知搜索引擎，让搜索引擎只抓取筛选结果页，为用户和搜索引擎节省时间。

Robots文件写法中Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址，通过这种方式，如果网站的无效页面不希望被搜索引擎收录，可以屏蔽掉低质量的页面，告诉搜索引擎哪些页面可以抓取，有效的避免黑洞的形成。

来源：搜外网

Public @ 2014-02-24 16:09:26

robot 禁止抓取图片

User-agent: *Disallow: .jpg$jpg可以代替为gif，png 等等...

Public @ 2020-04-11 16:09:30

一级目录是什么一级目录继承在主站目录下的，相当于在网站的根目录下再建立一个文件夹存放网站。从严格上讲，目录是按"/"来算的，不算最后的“/”，域名中有一个“/”的就是一级目录，有两个“/”的就是二级目录。类似www.seowhy.com/faq、www.seowhy.com/faq/ 就是一级目录。举个例子：我建一个简单的html文件，命名为123.html，上传到搜外网站根目

Public @ 2018-12-09 16:11:39

百度robots中的user-agent

百度各个产品使用不同的user-agent:无线搜索Baiduspider-mobile图片搜索Baiduspider-image视频搜索Baiduspider-video新闻搜索Baiduspider-news百度搜藏Baiduspider-favo百度联盟Baiduspider-cpro商务搜索Baiduspider-ads网页以及其他搜索Baiduspider来源：360站长平台

Public @ 2022-11-11 16:09:02

robots.txt文件的格式

"robots.txt"文件包含一条或更多的记录，这些记录通过空行分开（以CR,CR/NL, or NL作为结束符），每一条记录的格式如下所示："<field>:<optionalspace><value><optionalspace>"。在该文件中可以使用#进行注解，具体使用方法和UNIX中的惯例一样。该文件

Public @ 2019-06-19 16:09:32

Categories

Tags