Categories


Tags


常见Robots名字

名称 搜索引擎

google蜘蛛: googlebot

百度蜘蛛:baiduspider

yahoo蜘蛛:slurp

alexa蜘蛛:ia_archiver

msn蜘蛛:msnbot

altavista蜘蛛:scooter

lycos蜘蛛: lycos_spider_(t-rex)

alltheweb蜘蛛: fast-webcrawler/

inktomi蜘蛛: slurp

一个在线写robots.txt的工具。

最后需要注意,robots.txt文件名必须是小写,而且放在网站根目录

来源:360站长平台


Public @ 2013-05-19 16:09:03

虚拟主机怎么设置404页面?

要设置虚拟主机的404页面,可以按照以下步骤进行操作: 1. 打开虚拟主机管理面板,在菜单栏中找到“错误页面”或者“定制错误页面”等设置选项。 2. 找到404错误页面设置选项,通常可以选择使用默认的404错误页面或者自定义404错误页面。 3. 如果选择使用默认的404错误页面,则无需做任何设置即可使用。 4. 如果选择自定义404错误页面,则需要新建一个404.html或者404.ph

Public @ 2023-03-31 22:50:29

浅谈404问题

今天为什么要说一下404问题呢,最近看case过程中发现个很有意思的网站,该网站被灌了大量的垃圾信息,被其发现后及时地进行了删除,这一点是值得肯定的。通常情况下,正常网站将自动返回404状态码,搜索引擎进行更新并删除,避免对网站用户及搜索引擎带来负面影响。但问题来了,该网站只删除了内容,没有任何主体内容的页面被保存了下来,未做404处理。当然,存在一类网站只删除内容后返回正常200状态码,提醒一句

Public @ 2014-09-24 16:09:54

哪些网站的目录需求运用robots.txt文件制止抓取

1. 银行和金融机构的网站,因为这些网站可能包含敏感信息,例如客户的个人和财务信息。 2. 医疗保健机构的网站,因为这些网站可能包含个人医疗信息。 3. 艺术、音乐和影片网站,因为这些网站可能包含受版权法保护的内容。 4. 政府网站,特别是警察局和情报机构的网站,因为这些机构的网站可能包含安全敏感信息。 5. 搜索引擎的漏洞报告网站,因为这些网站可能敏感地显示诸如数据库配置、文件位置等敏感

Public @ 2023-06-15 06:00:13

robots文件中屏蔽的为什么还可以收录?

我今天来给大家详细讲解下,先了解几个概念1、robots只是禁止抓取,不是禁止收录2、另外还有nofollow的作用不是不抓取这个链接,是不从这个链接传递权重了解这2个概念后,我们再来讨论怎么处理这类收录问题:robots写正确的同时,不要在任何一家收录的网站发外链,友链,也不要主动提交百度,这样才可以保证不被搜索引擎收录,为什么呢?大家百度查一下淘宝,如图:按照道理淘宝写了robots怎么还是收

Public @ 2021-04-26 16:09:29

更多您感兴趣的搜索

0.484201s