Categories


Tags


头条搜索Robots匹配说明

匹配方式

分两部分:1.path部分,2.参数部分

匹配支持?*$?两种通配符

?*? 表示任何有效字符的 0 个或多个个案。

?$? 表示网址结束。

path部分

与google匹配方式保持一致,也就是只有/或是*开头的规则才有机会匹配上

?/?

匹配根目录以及任何下级网址

?/fish?

?/fish?开头的

匹配项

* ?/fish?

* ?/fish.html?

* ?/fish/salmon.html?

* ?/fishheads?

* ?/fishheads/yummy.html?

* ?/fish.php?id=anything?

不匹配项

* ?/Fish.asp?

* ?/catfish?

* ?/?id=fish?

?/fish\*?

等同于 ?/fish?。结尾的通配符会被忽略。

匹配项:

* ?/fish?

* ?/fish.html?

* ?/fish/salmon.html?

* ?/fishheads?

* ?/fishheads/yummy.html?

* ?/fish.php?id=anything?

不匹配项:

* ?/Fish.asp?

* ?/catfish?

* ?/?id=fish?

?/fish/?

结尾的斜杠表示此项与此文件夹中的任何内容均匹配。

匹配项:

* ?/fish/?

* ?/fish/?id=anything?

* ?/fish/salmon.htm?

不匹配项:

* ?/fish?

* ?/fish.html?

* ?/Fish/Salmon.asp?

?/\*.php?

匹配项:

* ?/filename.php?

* ?/folder/filename.php?

* ?/folder/filename.php?parameters?

* ?/folder/any.php.file.html?

* ?/filename.php/?

不匹配项:

* ?/?(即使其映射到 /index.php)

* ?/windows.PHP?

?/\*.php$?

匹配项:

* ?/filename.php?

* ?/folder/filename.php?

不匹配项:

* ?/filename.php?parameters?

* ?/filename.php/?

* ?/filename.php5?

* ?/windows.PHP?

?/fish\*.php?

匹配项:

* ?/fish.php?

* ?/fishheads/catfish.php?parameters?

不匹配项: ?/Fish.PHP?

?\*/ `` fish `` /?

包含/fish/的path

匹配项:

* ?/search/fish/filename.php?parameters?

* ?/fish/filename.php?parameters?

不匹配项:

* ?/Fish.PHP?

?.htm$?

错误写法,不能与.htm结尾的url匹配

参数部分

支持参数无序匹配,参数key value均支持?\*?通配符

?/home.php?mod=?

value可以是任意值

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mod=xxx?

不匹配项

* ?/home.php?c=0&smod=939?

* ?/home.php?c=0&mods=939?

?/home.php?mod=\*?

value可以是任意值,等同于?/home.php?mod=?

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mod=xxx?

不匹配项

* ?/home.php?c=0&smod=939?

* ?/home.php?c=0&mods=939?

?/home.php?mod=9?

参数值要求完全相对才匹配

匹配项

* ?/home.php?c=0&mod=9?

不匹配项

* ?/home.php?c=0&mod=939?

?/home.php?mod=9\*?

value以9开头的

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mod=9xx?

* ?/home.php?c=0&mod=9?

不匹配项

* ?/home.php?c=0&mod=3xx?

* ?/home.php?c=0&mod=39x?

?/home.php?mod=\*9?

value以9结尾

匹配项

* ?/home.php?c=0&mod=xx9?

不匹配项

* ?/home.php?c=0&mod=34?

* ?/home.php?c=0&mods=9?

* ?/home.php?c=0&mod=93?

?/home.php?mod=\*39?

value以39结尾的

匹配项

* ?/home.php?c=0&mod=939?

不匹配项

* ?/home.php?c=0&mod=9319?

?/home.php?\*mod=939?

key以mod结尾的

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&smod=939?

不匹配项

* ?/home.php?c=0&mods=939?

?/home.php?mod\*=939?

key以mod开头的

匹配项

* ?/home.php?c=0&mods=939?

* ?/home.php?c=0&mod=939?

不匹配项

* ?/home.php?c=0&smod=939?

?/home.php?\*mod\*=939?

key包含mod字符串

匹配项

* ?/home.php?c=0&smods=939?

* ?/home.php?c=0&mods=939?

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&smod=939?

不匹配项

* ?/home.php?c=0&msod=939?

?/home.php?\*mod\*=\*39\*?

key 包括mod字符串,value包含39字符串

匹配项

* ?/home.php?c=0&smods=939?

* ?/home.php?c=0&smod=39?

* ?/home.php?c=0&mod=939?

不匹配项

* ?/home.php?c=0&msod=93?

?/home.php?mod?

参数部分采用前缀匹配

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mods=939?

不匹配

* ?/home.php?c=0&smod=939?

?/home.php?mod\*?

匹配项

* ?/home.php?c=0&mod=939?

* ?/home.php?c=0&mods=939?

不匹配项

* ?/home.php?c=0&smod=34

来源:头条搜索站长平台


Public @ 2011-09-27 16:09:01

nofollow标签的作用有重大变化

nofollow标签是一种发送信号给搜索引擎,表明某个链接并没有推荐价值或者仍然需要被确认,从而在搜索引擎收录索引中减少该链接的收录的技术。当引用链接的页面需要降低权重,或者是垃圾链接以及狗仔站点被引用时,采用 rel=”nofollow” 就能限制搜索引擎把这些链接当做收录的对象,达到抑制搜索结果质量下降的目的。

Public @ 2023-02-24 14:24:26

robots简介

搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游

Public @ 2022-05-30 16:09:18

robots.txt文件的格式

robots.txt文件的格式为: User-agent: [user-agent-name] Disallow: [URL path] 其中,[user-agent-name]指代搜索引擎爬虫的名称,[URL path]指代禁止访问的URL路径。在文件中可以定义多条User-agent和Disallow规则,每一条规则占一行,每一对规则之间要有一个空行。示例: User-agent: *

Public @ 2023-05-28 01:50:08

robot.txt在SEO中的作用

鉴于网络安全与隐私的考虑,搜索引擎遵循robots.txt协议。通过根目录中创建的纯文本文件robots.txt,网站可以声明不想被robots访问的部分。每个网站都可以自主控制网站是否愿意被搜索引擎收录,或者指定搜索引擎只收录指定的内容。当一个搜索引擎的爬虫访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果该文件不存在,那么爬虫就沿着链接抓取,如果存在,爬虫就会按照该文

Public @ 2023-01-27 16:09:31

更多您感兴趣的搜索

0.808022s