360搜索对Robots协议的支持
360搜索支持Robots协议的主要命令,以下为具体说明:
1. user-agent
360搜索各产品的爬虫user-agent为:
- 网页搜索 360Spider
- 图片搜索 360Spider-Image
- 视频搜索 360Spider-Video
2. Allow
站长可通过Allow命令指定建议收录的文件、目录 。
3. Disallow
站长可通过Disallow命令指定不建议收录的文件、目录。
360搜索支持Robots协议的主要命令,以下为具体说明:
1. user-agent
360搜索各产品的爬虫user-agent为:
- 网页搜索 360Spider
- 图片搜索 360Spider-Image
- 视频搜索 360Spider-Video
2. Allow
站长可通过Allow命令指定建议收录的文件、目录 。
3. Disallow
站长可通过Disallow命令指定不建议收录的文件、目录。
ETag是一种HTTP协议中的实体标签,用于标记某个资源的版本号。它在浏览器与服务器之间起到了缓存控制的作用,提高了网页的加载速度和用户的浏览体验。下面是ETag使用效果对比和经验分享: 1. 提高缓存命中率:当用户再次访问同一资源时,浏览器会向服务器发送请求,服务器会比较资源的ETag值与请求头中的If-None-Match值是否一致。如果一致,则返回状态码304 Not Modified,表
301永久重定向是所有的重定向方法中一种符合搜索引擎规则的重定向方法,其他的重定向还包括302暂时重定向和JS跳转等,这些方式都容易导致URL不规范问题的产生。所以说如果你有多个域名都希望可以让他们访问同一个网站,那就只能将其中一个做为主域名,剩下的其他域名做301永久重定向到这个主域名,只有这样才可以让多个域名都访问一个站点,不会产生重复收录,导致网站被惩罚的现象
360搜索对Robots协议进行了扩展,增加了以下几个指令: 1. User-Agent:用于指定搜索引擎访问网站时使用的用户代理字符串,可以设置多个User-Agent。 2. Crawl-delay:用于指定搜索引擎访问网站时的延迟时间,单位为秒。可以设置针对不同的User-Agent的延迟时间。 3. Sitemap:用于指定网站的sitemap文件的地址,搜索引擎将通过该文件获取站点
网站上有些页面不希望被搜索引擎收录,我们可以使用robots的文件或者meta robots 标签。什么是meta robots 标签?meta robots 标签是页面head部分meta标签的一种,用于指令搜索引擎禁止索引(收录)本页内容。meta robots 标签的写法:<meta name=”robots”content=”noindex,nofollow”>标签的意义:禁止