Categories


Tags


360搜索对Robots协议的扩展

360搜索根据站长们的反馈,会陆续推出扩展的Robots协议命令。这些命令将能帮助站长们提高和360搜索爬虫沟通的效率,减少站长们维护Robots协议文件的技术成本。

360搜索首个扩展命令是:indexpage,站长们可以使用此命令告知360搜索哪些网页经常更新。360搜索会根据站长的指示以及自己的算法,智能调整爬虫抓取频率,实现对您网站新内容的更高频率抓取。

在命令中可以使用*、$等通配符。

示例:

使用通配符的

Indexpage: http://bbs.360safe.com/forum-*-1.html$

Indexpage: http://ent.sina.com.cn/*/roll.html

不用通配符的:

Indexpage: http://roll.tech.sina.com.cn/internet_all/index.shtml

Indexpage: http://roll.tech.sina.com.cn/it/index.shtml

Indexpage: http://roll.tech.sina.com.cn/tele/index.shtml

Indexpage: http://roll.tech.sina.com.cn/discovery/index.shtml

Indexpage: http://roll.tech.sina.com.cn/elec/index.shtml


Public @ 2019-02-15 16:09:33

网站结构有哪些类型1:什么是树状结构

网站结构有以下类型: 1. 线性结构:网页按照线性顺序呈现,用户只能按照给定的路径进行操作。 2. 并列结构:网页中的多个页面并列展示,用户可以按照自己的意愿任意选择。 3. 分层结构:根据主题或类别将网页分成不同的层次,并且每一层都有相应的子页链接。 4. 网状结构:网页中的所有页面都可以互相连接,没有明确的层次结构。 5. 混合结构:以上几种结构的组合。 树状结构是一种分层结构,也称为层次

Public @ 2023-04-16 03:50:18

Robots.txt 文件应放在哪里?

obots.txt 文件必须放在网站的根目录。放在子目录的 Robots.txt 文件搜索引擎不能爬取到,所以不会起任何作用。如:https://www.seowhy.com/robots.txt    是有效的。https://www.seowhy.com/a/robots.txt  是无效的。以下3种情况需要注意:1、如果手机网站采用的是m.的二级域名,要给手机网

Public @ 2018-08-20 16:09:23

头条搜索Robots匹配说明

头条搜索Robots匹配说明是指在头条搜索引擎中,用户输入的搜索关键词与已经编写好的机器人规则进行匹配,用以判断搜索结果的排序和展示方式。这些机器人规则是由头条搜索建立的算法模型,通过对用户的搜索历史、搜索习惯、查询的信息内容等多方面的分析,提供给用户最符合其需求的搜索结果。Robots匹配在很大程度上影响用户在头条搜索引擎中的搜索体验和结果准确性。

Public @ 2023-04-05 00:50:10

更多您感兴趣的搜索

0.390031s