Categories


Tags


robots里这样写,就能避免蜘蛛爬这个“index.htm”这个首页?

我robots这样写是不是就能避免蜘蛛爬这个“index.htm”这个首页?

User-agent: *

Disallow: /index.htm

11-30.

我的index.htm是现在默认的首页,想屏蔽蜘蛛抓取。让蜘蛛爬另一个文档,主要是规避备案巡查

我的网站和我备案的不一样,服务器那边要求改,我就整了个htm文档来规避下。

写法没有问题。但正常的不建议屏蔽首页地址,,“index.htm”这个后缀地址是需要处理掉的。

当然,如果只是应付备案短暂需求,,就只能这样处理。

后续备案处理后,尽快处理后缀“index.htm”。同时robots修改回去。

来源:搜外网


Public @ 2019-12-16 16:09:25

如何选择seo外包商而不被忽悠

1.寻找口碑好的SEO外包公司,可以在相关社交媒体中寻找关于该公司的评论、评价和建议。 2.了解SEO的基础知识,不要轻信外包公司过度吹嘘的SEO成果。 3.与SEO外包公司沟通,了解他们的工作流程、策略和方法。 4.注意合同细节,确保合同中明确外包公司需要完成的任务、时间和价格等方面的细节。 5.提前了解SEO行业的相关规定和最新的算法更新。 6.选择具有多年丰富SEO实战经验的外包公

Public @ 2023-04-10 21:00:48

讲3个SEO相关小问题!权重+收录+15天定律!

1. 权重问题: 如何提升网站权重? 答:提升网站权重的方法很多,比如优化网站内容质量,增加外部链接,提高网站访问速度等。关键是要保持网站的更新频率,同时根据搜索引擎的算法来进行优化,逐渐提升网站的权重。 2. 收录问题:如何快速收录网站? 答:为了让搜索引擎更快地收录网站,可以使用站长工具提交站点地图,并在社交媒体平台发布网站内容,通过外链的方式进行传播,提高网站知名度和曝光率。同时,保持

Public @ 2023-06-01 18:50:25

robot.txt在SEO中的作用

鉴于网络安全与隐私的考虑,搜索引擎遵循robots.txt协议。通过根目录中创建的纯文本文件robots.txt,网站可以声明不想被robots访问的部分。每个网站都可以自主控制网站是否愿意被搜索引擎收录,或者指定搜索引擎只收录指定的内容。当一个搜索引擎的爬虫访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果该文件不存在,那么爬虫就沿着链接抓取,如果存在,爬虫就会按照该文

Public @ 2023-01-27 16:09:31

robots.txt语法教程

robots.txt 是一个文件,它位于网站的根目录下,用于告诉搜索引擎和机器人哪些页面可以被访问或哪些不应该被访问。以下是 robots.txt 语法教程。 1. User-agent User-agent 表示搜索引擎或机器人的名称。当网站管理员想要禁止某个搜索引擎或机器人访问网站时,可以使用 User-agent 指定名称。 例如: User-agent: Googlebot Dis

Public @ 2023-06-06 11:00:18

更多您感兴趣的搜索

0.523943s