Categories


Tags


robots里这样写,就能避免蜘蛛爬这个“index.htm”这个首页?

我robots这样写是不是就能避免蜘蛛爬这个“index.htm”这个首页?

User-agent: *

Disallow: /index.htm

11-30.

我的index.htm是现在默认的首页,想屏蔽蜘蛛抓取。让蜘蛛爬另一个文档,主要是规避备案巡查

我的网站和我备案的不一样,服务器那边要求改,我就整了个htm文档来规避下。

写法没有问题。但正常的不建议屏蔽首页地址,,“index.htm”这个后缀地址是需要处理掉的。

当然,如果只是应付备案短暂需求,,就只能这样处理。

后续备案处理后,尽快处理后缀“index.htm”。同时robots修改回去。

来源:搜外网


Public @ 2019-12-16 16:09:25

零基础开启网站SEO的生命周期

1. 确定关键词:了解目标市场和网站目标后,确定关键词列表。 2. 分析竞争对手:了解竞争对手的网站结构、内容、关键词和排名等信息。 3. 优化网站结构:包括网站目录结构、URL优化、内部链接、网站地图等。 4. 优化页面内容:包括标题、描述、关键词密度、图片优化、内容排版等。 5. 提高页面加载速度:优化图片大小、减少HTTP请求、压缩CSS/JS等。 6. 优化移动端体验:网站适应各

Public @ 2023-04-21 15:50:29

哪些因素正在影响百度搜索结果排序?

作为AI语言模型,我无法确定具体的搜索结果排序因素,但以下是可能的因素: 1. 用户的搜索历史、地理位置和设备信息 2. 网页质量和内容的相关性与权威性 3. 网站的排名和可信度 4. 搜索关键词的重要性和热门程度 5. 网站的可访问性和页面速度 6. 社交媒体的活动和用户评论的数量和质量 7. 网站的知名度和品牌价值 8. 使用者的反馈,不断的更新和调整算法 这些因素可能会在百度搜索结果的排

Public @ 2023-05-29 18:50:13

关于robots.txt的二三事

【Robots简介】robots.txt是一个协议,是搜索引擎访问网站时第一个要查看的文件,它存在的目的是告诉搜索引擎哪些页面能被抓取,哪些页面不能被抓取。当spider访问一个站点时,会首先检查该站点根目录下是否存在robots.txt,如果存在,spider会按照文件中的内容来确定访问的范围;如果该文件不存在,所有的spider将能够访问网站上所有没有被口令保护的页面。【具体介绍】1、User

Public @ 2017-02-13 16:09:19

Robots META标签的写法

如果您想让搜索引擎忽略某些网页,可以使用"robots" META标签。以下是这种标签的写法: ```html ``` 上述标签将告诉搜索引擎不要索引或跟踪该网页。下面是一些其他常见的指令: - "index" 将指令搜索引擎索引该页面。 - "follow" 将指令搜索引擎跟踪此页面上的链接。 - "noindex" 将指令搜索引擎不要索引此页面。 - "nofollow" 将指令搜索引擎

Public @ 2023-04-08 21:50:38

更多您感兴趣的搜索

0.458782s