Categories


Tags


robots.txt语法教程

用几个最常见的情况,直接举例说明:

1. 允许所有SE收录本站:robots.txt为空就可以,什么都不要写。

2. 禁止所有SE收录网站的某些目录:

User-agent: *

Disallow: /目录名1/

Disallow: /目录名2/

Disallow: /目录名3/

3. 禁止某个SE收录本站,例如禁止百度:

User-agent: Baiduspider

Disallow: /

4. 禁止所有SE收录本站:

User-agent: *

Disallow: /

5. 加入sitemap.xml路径,例如:

来源:360站长平台


Public @ 2017-12-16 16:09:16

robots.txt文件的格式

User-agent: [robot名稱] Disallow: [禁止存取的目錄或檔案] Allow: [允許存取的目錄或檔案] Sitemap: [網站地圖檔案位置] 注意事項: - User-agent:要設定的是區分搜索引擎的機器人,可設定多個。若不加此欄位,則視為通用設定。 - Disallow:機器人不可存取的目錄或檔案,在此設定時,要注意目錄名稱或檔案名稱是完整的,不

Public @ 2023-06-17 03:50:39

如何利用robots.txt对wordpress博客进行优化

1、禁止索引 /wp-admin:用于管理wordpress网站的控制面板,不允许百度收录,避免流量分散。 User-agent: * Disallow: /wp-admin/ 2、禁止索引/wp-includes:WordPress中的核心文件,利用文件禁止百度爬行,提高访问速度。 User-agent: * Disallow: /wp-includes/ 3、禁止索引/wp-c

Public @ 2023-03-02 23:00:12

禁止搜索引擎收录的方法

以下是禁止搜索引擎收录网站的方法: 1. Robots.txt文件 在网站根目录下建立一个名为“robots.txt”的文件,通过添加禁止搜索引擎收录的指令来控制搜索引擎抓取页面的行为。 2. HTML标签 在网页头部添加的标记,使其被搜索引擎识别为不允许被收录的页面。 3. 登录权限 通过设置网站登录权限,使未登录用户无法访问该网页,从而使搜索引擎无法抓取该页面内容。 4. 封锁I

Public @ 2023-06-26 06:50:17

robots里这样写,就能避免蜘蛛爬这个“index.htm”这个首页?

我robots这样写是不是就能避免蜘蛛爬这个“index.htm”这个首页?User-agent: *Disallow: /index.htm11-30.我的index.htm是现在默认的首页,想屏蔽蜘蛛抓取。让蜘蛛爬另一个文档,主要是规避备案巡查我的网站和我备案的不一样,服务器那边要求改,我就整了个htm文档来规避下。写法没有问题。但正常的不建议屏蔽首页地址,,“index.htm”这个后缀地址

Public @ 2019-12-16 16:09:25

更多您感兴趣的搜索

0.542371s