Categories


Tags


头条搜索站长平台-sitemapindex文件要求

sitemapindex文件根节点必须是<sitemapindex>。

sitemapindex文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>。

sitemapindex文件禁止使用命名空间,禁止使用规定之外的属性。

sitemapindex文件大小不得超过5M,sitemap节点数量不超过1W。

必须保证sitemap中所有URL可访问,且内容符合XML数据文件规范。

1.XML数据文件规范

数据XML文件的根节点必须为<DOCUMENT>

数据XML文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>

数据XML文件禁止使用命名空间,禁止使用规定之外的属性。

数据XML单个文件大小不得超过10M(必须满足),item数目不得超过1W。

除根节点之外的其它节点,标签名建议采用英文小写字母及下划线‘_’

数据节点中包含转义字符,请使用CDATA

对于数组型的节点,请在只有一个子节点时保证和多个节点时的结构相同

2.Txt格式规范

Txt文件编码必须为UTF-8

Txt文件大小不得超过10M,每个文本文件最多可包含5w个网址

Txt文件每行都必须有一个网址,网址中不能有换行

Txt文件中不能包含网址列表以外的任何信息

- 必须书写完整的网址,包含http/https

- 必须保证Txt文件中所有URL 可访问,且内容符合Txt数据规范

注意事项

提交的sitemap有作弊嫌疑的url,头条将进行严厉的处罚措施并取消相关权限

头条spider有自身的爬取规则,sitemap只是帮助头条spider更好的收录您的网站,提交sitemap并不会决定网站收录或者排名。

来源:头条搜索站长平台


Public @ 2013-06-03 16:09:47

404页面是什么?

404页面是客户端在浏览网页时,服务器无法正常提供信息,或是服务器无法回应,且不知道原因所返回的页面。据说在第三次科技革命之前,互联网的形态就是一个大型的中央数据库,这个数据库就设置在404房间里面。那时候所有的请求都是由人工手动完成的,如果在数据库中没有找到请求者所需要的文件,或者由于请求者写错了文件编号,用户就会得到一个返回信息:room 404 : file not found。404错误信

Public @ 2014-05-13 16:11:01

什么是内部链接

内部链接部分列出所有页面的内部链接数。站长从这里可以大致判断网站内部链接结构是否有重大缺陷。如果全站主导航中出现的分类首页内部链接数非常低,很可能说明导航系统有问题。内部链接数的另一个作用是反映出网站收录页面数。Google的site:指令也不太准确,而且现在越来越不准确,经常不能反映出收录数字。网管工具中内部链接部分列出的首页内部链接总数,大致上就相当于Google收录的页面总数,因为网站上每一

Public @ 2014-06-29 16:11:28

什么是ETag?ETag作用有哪些

ETag是HTTP协议中的一个响应头部字段,用于标识HTTP请求的资源版本。一般由服务器生成,类似于一个唯一标识符,与该资源的内容相关联。ETag的值可以是任何由服务器生成的标识符,例如文件的修改时间戳、哈希值等。 ETag的主要作用有以下几个: 1. 缓存控制:当客户端请求资源时,客户端可以与服务器之间比较ETag的值来判断资源是否过期。如果ETag值相同,则表明资源没有发生变化,客户端可以

Public @ 2023-03-28 23:50:29

站点地图的重要性

站点地图是一种网站页面,它列出了所有网站页面的链接列表,以方便用户查找和导航网站。站点地图包含的信息包括网站的结构,主要链接,页面层次结构,重要更新等。以下是站点地图的几个重要性: 1. 改善用户体验:站点地图为用户提供了一个完整的网站目录,使他们能够轻松地浏览网站并查找所需信息。 2. 提高搜索引擎优化:搜索引擎爬虫可以更轻松地索引站点地图。站点地图是向搜索引擎发送网站的重要信号。 3.

Public @ 2023-04-29 19:00:10

更多您感兴趣的搜索

0.442732s