Categories


Tags


robots简介

搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。

您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。

robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不能被搜索引擎的漫游器获取的,哪些是可以被(漫游器)获取的。 因为一些系统中的URL是大小写敏感的,所以robots.txt的文件名应统一为小写。robots.txt应放置于网站的根目录下。如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据。

Robots.txt协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。注意Robots.txt是用字符串比较来确定是否获取URL,所以目录末尾有和没有斜杠"/"这两种表示是不同的URL,也不能用"Disallow: *.gif"这样的通配符。

其他的影响搜索引擎的行为的方法包括使用robots元数据:

<meta name="robots" content="noindex,nofollow" />

这个协议也不是一个规范,而只是约定俗成的,通常搜索引擎会识别这个元数据,不索引这个页面,以及这个页面的链出页面

robots.txt文件放在哪里?

robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站时,首先会检查该网站中是否存在这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。

来源:360站长平台


Public @ 2022-05-30 16:09:18

内部链接(站内链接)的优化

内部链接(站内链接)的优化指的是在网站内部页面之间加入链接,以便提升网页的流量和搜索引擎排名。以下是内部链接优化的几个方法: 1. 添加相关内部链接:在每个页面中添加与此页面相关的内部链接,使读者更容易流转到其他相关的页面,也有利于搜索引擎对网站内容进行分类分析。 2. 在导航栏添加链接:在网站顶部的导航栏上添加内部链接,以便访问者可以快速找到网站的相关内容。 3. 使用关键词进行链接:使用

Public @ 2023-06-18 00:00:28

定向锚文本是什么?定向锚文本的意义

锚文本指的是,带着关键词的一个链接。如:SEO。在本站的所有教程中,我们发现,锚文本起到根本性的作用。如果一定要给SEO一个简单的操作要素,可以简单说,SEO工作就是不断的做锚文本。今天我们要学会一个词,叫定向锚文本。理解这个词,对我们彻底把SEO做到极致有重要指导意义。定向锚文本是什么定向锚文本指的是一个词与其指向的页面正在优化的关键词具有一致性。比如说关键词是SEO,并且带有链接,打开这个链接

Public @ 2018-03-19 16:11:31

阻止个人信息在搜索引擎中出现

个人信息一旦在网上发布,很有可能会被百度搜索引擎抓取,特别是在知名社交网站、专业网站上发布的内容。可能您并不希望这类个人信息出现在百度搜索结果中,以下方式可以帮助您阻止个人信息在搜索结果中出现。如果您是在其他网站上发布的内容:1、在社交网站中(例如人人网,开心网等),您可以针对个人信息设置浏览权限,例如只有朋友或者自己可以浏览;如果您不愿让陌生人看到某些照片或信息,则应该慎重考虑是否公开发布这些内

Public @ 2016-01-12 16:08:57

Robots META标签的写法

如果您想让搜索引擎忽略某些网页,可以使用"robots" META标签。以下是这种标签的写法: ```html ``` 上述标签将告诉搜索引擎不要索引或跟踪该网页。下面是一些其他常见的指令: - "index" 将指令搜索引擎索引该页面。 - "follow" 将指令搜索引擎跟踪此页面上的链接。 - "noindex" 将指令搜索引擎不要索引此页面。 - "nofollow" 将指令搜索引擎

Public @ 2023-04-08 21:50:38

更多您感兴趣的搜索

0.491273s