Categories


Tags


360搜索对Robots协议的扩展

360搜索根据站长们的反馈,会陆续推出扩展的Robots协议命令。这些命令将能帮助站长们提高和360搜索爬虫沟通的效率,减少站长们维护Robots协议文件的技术成本。

360搜索首个扩展命令是:indexpage,站长们可以使用此命令告知360搜索哪些网页经常更新。360搜索会根据站长的指示以及自己的算法,智能调整爬虫抓取频率,实现对您网站新内容的更高频率抓取。

在命令中可以使用*、$等通配符。

示例:

使用通配符的

Indexpage: http://bbs.360safe.com/forum-*-1.html$

Indexpage: http://ent.sina.com.cn/*/roll.html

不用通配符的:

Indexpage: http://roll.tech.sina.com.cn/internet_all/index.shtml

Indexpage: http://roll.tech.sina.com.cn/it/index.shtml

Indexpage: http://roll.tech.sina.com.cn/tele/index.shtml

Indexpage: http://roll.tech.sina.com.cn/discovery/index.shtml

Indexpage: http://roll.tech.sina.com.cn/elec/index.shtml


Public @ 2019-02-15 16:09:33

网站URL显示品牌名字怎么弄

要在网站URL中显示品牌名称,可以采用以下方法: 1. 建立一个包含品牌名称的域名,例如www.yourbrandname.com。 2. 将品牌名称包含在网站URL的子目录中,例如www.yourwebsite.com/yourbrandname。 3. 使用品牌名称作为网站URL的一部分,例如www.yourbrandname.yourwebsite.com。 4. 在网站的META标

Public @ 2023-06-17 09:00:13

301跳转常见问题汇总

Q1:什么是301跳转? 答:301重定向是一种网页重定向技术,将请求的网页移动到另一个网址,并在浏览器中显示新的网址。原因主要是为了实现网站的结构更改,以便用户能够快速、准确和对服务器最有利的方式访问网站。 Q2:为什么需要301跳转? 答:301跳转可以提高搜索引擎优化好处,确保移动到新网址的完整SEO价值,以及提高用户体验,避免出现错误。因此,301重定向被认为是必要的,特别是当你

Public @ 2023-02-25 09:48:21

robots.txt文件的格式

User-agent: [robot名稱] Disallow: [禁止存取的目錄或檔案] Allow: [允許存取的目錄或檔案] Sitemap: [網站地圖檔案位置] 注意事項: - User-agent:要設定的是區分搜索引擎的機器人,可設定多個。若不加此欄位,則視為通用設定。 - Disallow:機器人不可存取的目錄或檔案,在此設定時,要注意目錄名稱或檔案名稱是完整的,不

Public @ 2023-06-17 03:50:39

robots协议

 Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫扫除规范”(RobotsExclusionProtocol),网站经过Robots协议通知查找引擎哪些页面可以抓取,哪些页面不能抓取  是查找引擎的一部分来定位和索引互联网上的每个可能答复查找恳求的网页,一般只在评论robots的HTML标签或许robots.txt文件的时分运用。

Public @ 2010-10-17 15:26:25

更多您感兴趣的搜索

0.476992s