Categories


Tags


常见的robots.txt文件用法实例

常见的robots.txt文件用法实例:

1、禁止所有搜索引擎抓取网站的任何部分

User-agent: *

Disallow: /

这是禁止所有目录和文件被所有搜索引擎收录。网站还没上线时,有的会先屏蔽所有蜘蛛抓取。

2、允许所有的spider抓取(或者也可以建一个空的robots.txt文件)

User-agent: *

Allow: /

这是允许所有搜索引擎抓取网站的任何部分,既然是允许所有文件被抓取,可以不用创建robtos.txt文件,即默认全部允许抓取。

3、禁止spider抓取特定目录

User-agent: *

Disallow: /a/

Disallow: /b/

Disallow: /c/

这是禁止所有的spider抓取a、b、c目录。这个规则我们最常用到,比如网站的程序后台、程序目录等都可以禁止spider抓取,以减少spider无意义的浪费我们的空间资源。

4、禁止spider抓取搜索结果页面

User-agent: *

Disallow: /so_article?*

如果你网站的搜索结果页面URL格式如:/so_article?keyword=搜索关键字,则按以上格式进行屏蔽,注意最后带了一个星号*,代表屏蔽so_article?带头的所有URL。

对于大部分网站,常用的就是以上4种情况。

来源:搜外网


Public @ 2010-05-21 16:09:23

从SEO角度优化网站结构带来哪些好处?

网站的优化分为两大部分,一是网站结构的优化,二是页面上关键词的优化。今天主要讲的是网站结构优化,网站首页的布局对网站优化有着至关重要的作用,网站结构布局结构好才能吸引蜘蛛更好的抓取。从SEO角度优化网站结构带来哪些好处?1、提高用户体验网站结构针对于用户体验进行优化,考虑多维度用户的需求,提高多类型用户的体验度,让搜索引擎更好地收录我们的网站,从而提升网站排名。2、提高收录率优化网站的结构,建议形

Public @ 2019-03-09 16:12:08

nofollow标签的作用有重大变化

nofollow标签是一种发送信号给搜索引擎,表明某个链接并没有推荐价值或者仍然需要被确认,从而在搜索引擎收录索引中减少该链接的收录的技术。当引用链接的页面需要降低权重,或者是垃圾链接以及狗仔站点被引用时,采用 rel=”nofollow” 就能限制搜索引擎把这些链接当做收录的对象,达到抑制搜索结果质量下降的目的。

Public @ 2023-02-24 14:24:26

robots.txt文件的格式

User-agent: [robot名稱] Disallow: [禁止存取的目錄或檔案] Allow: [允許存取的目錄或檔案] Sitemap: [網站地圖檔案位置] 注意事項: - User-agent:要設定的是區分搜索引擎的機器人,可設定多個。若不加此欄位,則視為通用設定。 - Disallow:機器人不可存取的目錄或檔案,在此設定時,要注意目錄名稱或檔案名稱是完整的,不

Public @ 2023-06-17 03:50:39

robots协议

 Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫扫除规范”(RobotsExclusionProtocol),网站经过Robots协议通知查找引擎哪些页面可以抓取,哪些页面不能抓取  是查找引擎的一部分来定位和索引互联网上的每个可能答复查找恳求的网页,一般只在评论robots的HTML标签或许robots.txt文件的时分运用。

Public @ 2010-10-17 15:26:25

更多您感兴趣的搜索

0.466938s