Categories


Tags


robots里这样写,就能避免蜘蛛爬这个“index.htm”这个首页?

我robots这样写是不是就能避免蜘蛛爬这个“index.htm”这个首页?

User-agent: *

Disallow: /index.htm

11-30.

我的index.htm是现在默认的首页,想屏蔽蜘蛛抓取。让蜘蛛爬另一个文档,主要是规避备案巡查

我的网站和我备案的不一样,服务器那边要求改,我就整了个htm文档来规避下。

写法没有问题。但正常的不建议屏蔽首页地址,,“index.htm”这个后缀地址是需要处理掉的。

当然,如果只是应付备案短暂需求,,就只能这样处理。

后续备案处理后,尽快处理后缀“index.htm”。同时robots修改回去。

来源:搜外网


Public @ 2019-12-16 16:09:25

如何分析竞争对手网站

出来混的,多多少少都有那么点竞争对手,是敌亦是友,也是我们学习的榜样。做网站的都知道分析竞争对手的网站是网站推广和优化必不可少的一步。分析竞争对手成功与失败的经验,加入:对手的关键词排名、导入链接、点击广告等等,吸取有利的方面完善自己。还有不可忽视的就是那些发展非常快的潜在竞争对手。一:点击右键选择“查看源文件”。这是学会分析网站的必备功能,鼠标没右键的例外。点击右键查看源文件,重点就看三个,ti

Public @ 2022-09-15 15:32:33

关于网站删除页面对SEO的影响,说下谷歌的一些态度

谷歌认为,删除页面本身不会直接影响整个网站的SEO,但可能会影响这些页面的排名。如果删除页面时没有采取适当的操作,比如301重定向或404错误提示,那么会导致搜索引擎无法找到和更新相关页面的链接和内容,并且可能导致搜索排名下降。因此,如果需要删除页面,建议要谨慎操作,专业委托SEO优化公司进行统一的优化,以避免不必要的影响。

Public @ 2023-03-31 14:50:16

关于robots.txt的二三事

1. Robots.txt是一个协议,用于控制搜索引擎爬虫的访问范围。 2. Robots.txt文件位于网站的根目录下,包含了一些指令告诉爬虫哪些页面可以访问,哪些页面需要限制访问。 3. Robots.txt文件并不会阻止所有爬虫的访问,只有支持Robots.txt协议的爬虫才会遵守文件中的指令。 4. Robots.txt文件中的指令可以根据不同的爬虫进行个性化设置,可以控制不同爬虫访

Public @ 2023-04-11 13:00:34

更多您感兴趣的搜索

0.439743s