Categories


Tags


Sitemap文件标准格式和大小说明

1、格式:

您可以采用如下三种格式的文件向360搜索提交Sitemap,文件编码可以是UTF-8或GBK:
1)标准的XML格式文件
2)文本格式文件
3)Sitemap索引文件(可同时包含多个Sitemap文件)

2、大小:
1)单个Sitemap文件:大小不超过10MB,且包含不超过50000个网址。如果网站所包含的网址超过50,000个,则可将列表分割成多个Sitemap文件,放在Sitemap索引中。
2)单个Sitemap索引文件:大小不能超过500M,如果超过请提交多个Sitemap索引文件接口。


各格式样式参见以下说明:

1、XML格式Sitemap说明
1) XML格式举例

   <?xml version="1.0" encoding="utf-8"?>
   <!-- XML文件需以utf-8编码-->
   <urlset>
      <!--必填-->
       <url>
           <!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 -->
           <loc>http://www.xxxxxx.html/000000.html</loc>
           <!--必填,URL长度限制在256字节内-->
           <lastmod>2012-12-01</lastmod>
           <!--更新时间标签,非必填,用来表示最后更新时间-->
           <changefreq>daily</changefreq>
           <!--更新频率标签,非必填,用来告知引擎页面的更新频率 -->
           <priority>0.8</priority>
           <!--优先权标签,优先权值0.0-1.0,用来告知引擎该条url的优先级-->
       </url>
       <url>
           <loc>http://www.xxxxxx.html/000001.html</loc>
           <lastmod>2012-12-01</lastmod>
           <changefreq>daily</changefreq>
           <priority>0.8</priority>
       </url>
   </urlset>
2) XML标签说明

标签名称

属性

标签说明

标签类型

标签限制

可选/必选

changefreq 

/

标示数据更新频率

字符串

有效值为:always、hourly、daily、weekly、monthly、yearly、never

可选

lastmod

/

标示数据最新一次更新时间

日期

时间格式为yyyy-mm-dd 

可选

loc 

/

标示该条数据的存放地址

url 

最小长度1个字符最大长度256个字符以"http://"开头

必选

priority

/

标示优先值

小数

[0.0 1.0](大于等于0小于等于1,保留一位小数)例如:<   priority >0.8< priority >

可选

url 

/

url地址的开始和结束

最多出现无限次

必选

urlset 

/

urlset用来标记整个文档的开头

/

必选

2、文本格式Sitemap说明

文本格式文件每一行写入一个网址,除此之外不包含其他信息。网址必须完整,网址中不能有换行,且包括协议头(http://)

3、使用Sitemap索引文件(对多个Sitemap文件)说明
1) 索引Sitemap举例
   <?xml version="1.0" encoding="UTF-8"?>
   <sitemapindex>
     <sitemap>
       <loc>http://www.example.com/1.xml</loc>
       <lastmod>2012-12-01</lastmod>
     </sitemap>
     <sitemap>
       <loc>http://www.example.com/2.xml</loc>
       <lastmod>2012-12-01</lastmod>
     </sitemap>
   </sitemapindex>
 
2) Sitemap索引文件标签说明:

属性

是否必填项

说明

<loc> </loc>

Sitemap位置标签,标示sitemap地址位置

<lastmod> </lastmod>

可填

Sitemap修改时间标签,标示最新修改时间

<sitemap> </sitemap>

Sitemap信息说明,标示某个sitemep的信息

<sitemapindex></sitemapindex>

标示索引文件中所有sitemap的信息


Public @ 2010-11-01 16:11:51

链接深度是什么

链接深度是指一个网站内部链接的层级深度。在一个网站中,主页是深度为0的页面,主页上的链接指向的页面的深度为1,依此类推。深度越大,表示页面与主页之间的链接路径越长。通过了解链接深度可以帮助优化网站结构,提高搜索引擎的抓取效率和用户的浏览体验。

Public @ 2023-07-30 21:00:10

搜索引擎收录机制是什么?

搜索引擎收录机制就是搜索引擎系统执行网页抓取、URL分析、文本链接分析、内容分析及网页排序等一系列操作而形成的一种机制。这个机制由爬虫、索引和查询构成,爬虫存储所有网络上数据、分析搜索引擎索引,而搜索引擎索引就像物理上的索引一样,能让搜索引擎定位到目标页面;最后查询的时候则是让搜索引擎根据索引定位相应的页面,最终完成数据的展示。

Public @ 2023-03-03 13:00:15

头条搜索站长平台-sitemap异常原因解释

sitemap异常原因解释解决方法爬虫被封禁可能是您的网站对Bytespider的UA或IP进行封禁建议您根据我们公布的UA和IP进行解封,第二天重新抓取之后会恢复正常sitemap文件数据量过大可能是您的sitemap节点数量超过了5w个建议您拆分为几个小的sitemap文件sitemap地址非法可能是您的sitemap地址不可访问或者存在xml和txt混合模式的数据建议您按照我们的要求提交si

Public @ 2021-01-02 16:09:47

百度搜索资源平台-sitemap全网开放及建议启用Etag的公告

尊敬的用户: 为了更好地优化搜索资源平台的索引和抓取效率,提高网站页面的收录速度,我们决定将百度搜索资源平台的sitemap功能全网开放。从即日起,所有网站都可以使用sitemap协议向百度搜索推送网站的页面信息。 同时,我们也建议网站在sitemap中启用Etag机制。Etag是一种用于判断网页是否发生变化的机制,在网站页面发生变动时可以通过更新Etag来通知搜索引擎重新抓取该页面,从而保持

Public @ 2023-07-26 21:00:31

更多您感兴趣的搜索

0.446523s