Categories


Tags


robots里这样写,就能避免蜘蛛爬这个“index.htm”这个首页?

我robots这样写是不是就能避免蜘蛛爬这个“index.htm”这个首页?

User-agent: *

Disallow: /index.htm

11-30.

我的index.htm是现在默认的首页,想屏蔽蜘蛛抓取。让蜘蛛爬另一个文档,主要是规避备案巡查

我的网站和我备案的不一样,服务器那边要求改,我就整了个htm文档来规避下。

写法没有问题。但正常的不建议屏蔽首页地址,,“index.htm”这个后缀地址是需要处理掉的。

当然,如果只是应付备案短暂需求,,就只能这样处理。

后续备案处理后,尽快处理后缀“index.htm”。同时robots修改回去。

来源:搜外网


Public @ 2019-12-16 16:09:25

职场经验:做好这6点,升职加薪指日可待!

俗话说:大公司做人,小公司做事,当你的能力、格局等方方面面还不够“尖锐”、专业到可以独掌一面的时候,扎实沉在公司里,学习、沉淀、韬光养晦才是最靠谱的选择, 当然还有最主要的原因-养活自己。可惜的是,好多人看不到自己的真实能力,以及对于公司团队的价值产出,心心念念的只是自己的钱少、事儿多、任务重,不是腹议领导上司SB,不听从自己的英明建议;就是敷衍塞责于团队协作里的冷硬配合,让旁人只觉欠你N多钱一样

Public @ 2018-02-04 15:33:05

CDN怎么使用?你真的会用网站的CDN吗?省钱攻略!

作为一名AI语言模型,我并不具备实际操作CDN的能力,但是从理论上说,使用CDN的一般步骤是: 1.选择CDN服务提供商并注册账号。 2.在CDN服务提供商的管理界面中添加需要加速的网站。 3.根据CDN服务提供商提供的配置指南,在网站服务端和客户端分别进行相应的配置。 4.根据需要调整CDN缓存的时间、区域等设置。 5.在网站上发布内容后,通过访问CDN服务提供商的管理界面查看CDN缓存是否生

Public @ 2023-04-19 02:00:20

什么是meta robots 标签?meta robots 标签的写法

Meta robots标签是一种HTML头部元数据标签,用于指示搜索引擎如何处理指定页面的内容。它告诉网络爬虫如何爬取索引优化。这些标签是在和之间添加的,旨在为“robots(搜索引擎蜘蛛)”提供有关如何索引和缓存页面内容的指令。 以下是meta robots标签的写法: - - - - 其中,“content”属性指定一组用逗号分隔的值,可以是以下之一: - index:告诉爬

Public @ 2023-04-05 21:50:30

更多您感兴趣的搜索

0.528264s