Categories


Tags


百度Sitemap协议

百度Sitemap协议是百度支持的网页收录标准,站长可以将网站中的网页url制作成标准的Sitemap文件,用于指引百度搜索引擎快速、全面的抓取或更新网站上内容及处理错误信息。百度Sitemap支持标准的XML格式Sitemap文件以及文本格式的Sitemap文件,如果您有多个Sitemap文件,还可以使用Sitemap索引文件提交。每个Sitemap文件最多可包含50,000个网址,并且应小于 10MB(10,485,760字节)。我们支持UTF-8 编码和GBK编码的文件。

XML格式Sitemap说明:

XML格式举例:

XML格式举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <urlset>

        <url>

          <loc>http://www.example.com/</loc>

          <lastmod>2010-01-01</lastmod>

          <changefreq>always</changefreq>

          <priority>1.0</priority>

        </url>

        <url>

          <loc>http://www.example.com/1.html</loc>

          <lastmod>2010-02-14</lastmod>

          <changefreq>weekly</changefreq>

          <priority>0.8</priority>

        </url>

   </urlset>

索引Sitemap举例:

   <?xml version="1.0" encoding="UTF-8"?>

   <sitemapindex>

     <sitemap>

       <loc>http://www.example.com/1.xml</loc>

       <lastmod>2010-01-01</lastmod>

     </sitemap>

     <sitemap>

       <loc>http://www.example.com/2.xml</loc>

       <lastmod>2010-02-01</lastmod>

     </sitemap>

   </sitemapindex>

具体格式及规范说明请查看:http://zhanzhang.baidu.com/site/format

XML标签说明:



百度Sitemap协议-第1张图片-SEO自学网


文本格式Sitemap说明:

您可以提供纯文本文件,其中每行包含一个网址。

文本文件格式举例:

http://www.example.com/catalog?item=1

http://www.example.com/catalog?item=2

此文本文件需要遵循以下指南:


?         文本文件每行都必须只有一个网址。网址中不能有换行。


?         您必须指定完整的网址,包括“http://”。


?         每个文本文件最多可包含50,000个网址,并且应小于10MB(10,485,760字节)。如果网站所包含的网址超过50,000个,则可将列表分割成多个文本文件,然后分别添加每个文件。


?         文本文件需使用UTF-8编码或GBK编码。


?         文本文件不应包含网址列表以外的任何信息。


?         您可以使用gzip压缩Sitemap文件,以减少带宽要求;但是压缩前的Sitemap文件应小于10MB(10,485,760字节)。

使用Sitemap索引文件(对多个Sitemap文件)说明:

使用Sitemap索引文件必须:


?         以开始标记作为开始,以结束标记作为结束。


?         每个Sitemap包含一个条目作为 XML 父标记。


?         每个父标记包含一个子标记条目。


Sitemap索引文件标签说明:



百度Sitemap协议-第2张图片-SEO自学网



Public @ 2021-10-21 16:11:58

关于robots.txt的二三事

【Robots简介】robots.txt是一个协议,是搜索引擎访问网站时第一个要查看的文件,它存在的目的是告诉搜索引擎哪些页面能被抓取,哪些页面不能被抓取。当spider访问一个站点时,会首先检查该站点根目录下是否存在robots.txt,如果存在,spider会按照文件中的内容来确定访问的范围;如果该文件不存在,所有的spider将能够访问网站上所有没有被口令保护的页面。【具体介绍】1、User

Public @ 2017-02-13 16:09:19

如何解决网址规范化问题

解决网址规范化问题有以下几点方法:1.确保使用的CMS系统只产生规范化网址,无论是否有静态化。2.在Google管理员工具中设置首选域。3.所有内部链接保持统一,都指向规范化网址。4.使用canonical标签。5.使用301转向,把不规范化URL全部转向到规范化URL。6.提交给搜索引擎的XML网站地图中全部使用规范化网址。来源:搜外网

Public @ 2010-02-20 16:11:22

什么是ETag?ETag作用有哪些

ETag是HTTP协议提供的一种用于判断资源是否发生变化的机制。ETag是一个字符串,由服务器生成,在资源被更新时会发生变化。客户端请求资源时,服务器会将资源的ETag值一起返回,客户端可以缓存资源,并记录ETag值。当客户端再次请求该资源时,会将上次记录的ETag值一同发送给服务器。如果此时服务器返回的ETag值与客户端记录的值相同,就说明资源没有变化,客户端可以直接使用缓存的资源,减少网络请求

Public @ 2023-03-25 23:50:19

ETag使用效果对比&;经验分享

ETag是一种HTTP协议中的实体标签,用于标记某个资源的版本号。它在浏览器与服务器之间起到了缓存控制的作用,提高了网页的加载速度和用户的浏览体验。下面是ETag使用效果对比和经验分享: 1. 提高缓存命中率:当用户再次访问同一资源时,浏览器会向服务器发送请求,服务器会比较资源的ETag值与请求头中的If-None-Match值是否一致。如果一致,则返回状态码304 Not Modified,表

Public @ 2023-07-21 06:50:49

更多您感兴趣的搜索

0.410194s