Categories


Tags


360搜索对Robots协议的扩展

360搜索根据站长们的反馈,会陆续推出扩展的Robots协议命令。这些命令将能帮助站长们提高和360搜索爬虫沟通的效率,减少站长们维护Robots协议文件的技术成本。

360搜索首个扩展命令是:indexpage,站长们可以使用此命令告知360搜索哪些网页经常更新。360搜索会根据站长的指示以及自己的算法,智能调整爬虫抓取频率,实现对您网站新内容的更高频率抓取。

在命令中可以使用*、$等通配符。

示例:

使用通配符的

Indexpage: http://bbs.360safe.com/forum-*-1.html$

Indexpage: http://ent.sina.com.cn/*/roll.html

不用通配符的:

Indexpage: http://roll.tech.sina.com.cn/internet_all/index.shtml

Indexpage: http://roll.tech.sina.com.cn/it/index.shtml

Indexpage: http://roll.tech.sina.com.cn/tele/index.shtml

Indexpage: http://roll.tech.sina.com.cn/discovery/index.shtml

Indexpage: http://roll.tech.sina.com.cn/elec/index.shtml


Public @ 2019-02-15 16:09:33

叨叨死链这回事儿

经常有站长跑来问小so姐关于死链的问题,比如,我的网站有一些死链,会不会影响网站正常页面的收录;比如,除了404页面或者明显不能正常访问的页面,还有哪些属于死链范畴。今天,小so姐就来和大家叨叨死链这回事儿。【简要介绍】死链其实可以分为三种:协议死链,内容死链,跳转死链。协议死链,是指通过HTTP协议状态码明确表示网页已经无法访问,即页面打不开、服务器错误等。常见的如404、403、503状态等。

Public @ 2021-07-11 15:37:00

什么是meta robots 标签?meta robots 标签的写法

网站上有些页面不希望被搜索引擎收录,我们可以使用robots的文件或者meta robots 标签。什么是meta robots 标签?meta robots 标签是页面head部分meta标签的一种,用于指令搜索引擎禁止索引(收录)本页内容。meta robots 标签的写法:<meta name=”robots”content=”noindex,nofollow”>标签的意义:禁止

Public @ 2012-07-08 16:09:26

更多您感兴趣的搜索

0.474540s