Categories


Tags


百度Sitemap协议

百度Sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的Sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。百度Sitemap支持标准的XML格式Sitemap文件以及文本格式的Sitemap文件,如果您有多个Sitemap文件,还可以使用Sitemap索引文件提交。每个Sitemap文件最多可包含50,000个网址,并且应小于 10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。

XML格式Sitemap说明:

XML格式举例:

XML格式举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <urlset>

        <url>

          <loc>http://www.example.com/</loc>

          <lastmod>2010-01-01</lastmod>

          <changefreq>always</changefreq>

          <priority>1.0</priority>

        </url>

        <url>

          <loc>http://www.example.com/1.html</loc>

          <lastmod>2010-02-14</lastmod>

          <changefreq>weekly</changefreq>

          <priority>0.8</priority>

        </url>

   </urlset>

索引Sitemap举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <sitemapindex>

     <sitemap>

       <loc>http://www.example.com/1.xml</loc>

       <lastmod>2010-01-01</lastmod>

     </sitemap>

     <sitemap>

       <loc>http://www.example.com/2.xml</loc>

       <lastmod>2010-02-01</lastmod>

     </sitemap>

   </sitemapindex>

具体格式及规范说明请查看:http://zhanzhang.baidu.com/site/format

XML标签说明:



百度Sitemap协议-第1张图片-SEO自学网


文本格式Sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。

文本文件格式举例:

http://www.example.com/catalog?item=1

http://www.example.com/catalog?item=2

此文本文件需要遵循以下指南:


?         文本文件每行都必须只有一个网址。网址中不能有换行。


?         您必须指定完整的网址,包括“http://”。


?         每个文本文件最多可包含50,000个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过50,000个,则可将列表分割成多个文本文件,然后分别添加每个文件。


?         文本文件需使用UTF-8编码或GBK编码。


?         文本文件不应包含网址列表以外的任何信息。


?         您可以使用gzip压缩Sitemap文件,以减少带宽要求;但是压缩前的Sitemap文件应小于10MB(10,485,760字节)。

使用Sitemap索引文件(对多个Sitemap文件)说明:

使用Sitemap索引文件必须:


?         以开始标记作为开始,以结束标记作为结束。


?         每个Sitemap包含一个条目作为 XML 父标记。


?         每个父标记包含一个子标记条目。


Sitemap索引文件标签说明:



百度Sitemap协议-第2张图片-SEO自学网



Public @ 2021-10-21 16:11:58

Sitemap协议类型及包含范围

百度Sitemap协议支持提交收录网页列表以及死链列表。收录网页列表用于指引百度搜索引擎快速、全面的抓取网站上内容。您可以使用XML格式、文本格式以及Sitemap索引文件提交。死链列表用于提交您网站上被删除或者权限发生变动的网页列表,指引百度搜索引擎快速屏蔽这些网页。死链列表目前只能使用文本格式在百度站长平台提交。Sitemap文件的包含范围以主域为单位。如果您验证了 http://www.ex

Public @ 2021-01-23 16:11:58

头条搜索站长平台-sitemap异常原因解释

sitemap异常原因解释解决方法爬虫被封禁可能是您的网站对Bytespider的UA或IP进行封禁建议您根据我们公布的UA和IP进行解封,第二天重新抓取之后会恢复正常sitemap文件数据量过大可能是您的sitemap节点数量超过了5w个建议您拆分为几个小的sitemap文件sitemap地址非法可能是您的sitemap地址不可访问或者存在xml和txt混合模式的数据建议您按照我们的要求提交si

Public @ 2021-01-02 16:09:47

更多您感兴趣的搜索

0.591273s