Categories


Tags


头条搜索站长平台-sitemap异常原因解释

sitemap异常原因解释解决方法

爬虫被封禁可能是您的网站对Bytespider的UA或IP进行封禁建议您根据我们公布的UA和IP进行解封,第二天重新抓取之后会恢复正常

sitemap文件数据量过大可能是您的sitemap节点数量超过了5w个建议您拆分为几个小的sitemap文件

sitemap地址非法可能是您的sitemap地址不可访问或者存在xml和txt混合模式的数据建议您按照我们的要求提交sitemap地址

站点服务不可用我们请求您的网站3次后发现您的网站仍旧不可访问会暂时停止抓取,则返回该原因请您检查服务器是否可正常运转,如果正常,等正常调度后正常抓取

sitemap地址不存在可能是您的地址无法访问,返回404,我们获取不了任何信息请您排查sitemap地址链接,等正常调度后可恢复正常抓取

txt文件未发现有效链接可能是您的txt文件链接并非按照要求提供html链接请您按照我们的规范格式提交

xml文件数据量过大可能是您的xml文件大小超过10M,item数目超过1W个建议您拆分几个小的xml文件

来源:头条搜索站长平台


Public @ 2021-01-02 16:09:47

什么是meta robots 标签?meta robots 标签的写法

网站上有些页面不希望被搜索引擎收录,我们可以使用robots的文件或者meta robots 标签。什么是meta robots 标签?meta robots 标签是页面head部分meta标签的一种,用于指令搜索引擎禁止索引(收录)本页内容。meta robots 标签的写法:<meta name=”robots”content=”noindex,nofollow”>标签的意义:禁止

Public @ 2012-07-08 16:09:26

通过Canonical标签解决重复内容收录

Canonical标签是指在网页的HTML代码中添加一个链接指向该页面的主要版本,当页面有多个URL时,通过Canonical标签告诉搜索引擎哪个是主要版本,从而避免重复内容被收录。 例如,在网站中有一篇文章,URL分别是: http://www.example.com/article http://www.example.com/articles/123 http://www.examp

Public @ 2023-06-05 19:00:10

头条搜索站长平台-Sitemap提交

功能说明提交sitemap工具可以向头条搜索提交网站的sitemap文件,帮助头条spider更好的抓取您的网站。您可以在此工具下选择已经验证的站点,进行验证站点的sitemap文件提交。sitemap提交后,头条搜索会根据sitemap了解网站中数据情况。sitemap要求sitemapindex文件要求sitemapindex文件根节点必须是<sitemapindex>。sitem

Public @ 2010-06-17 16:09:48

Sitemap文件标准格式和大小说明

Sitemap文件标准格式: Sitemap文件通常是一个以XML格式编写的文本文件,其中包含URL信息和其他相关数据。Sitemap文件主要包含以下元素: 1. URL元素:用于指定页面的网址,并包含可选的数据,如最近的修改日期、相对于站点的相对权重等。 2. loc元素:为URL元素的子元素,用于指定页面的网址。 3. lastmod元素:为URL元素的子元素,用于指定页面的最近修改日期。

Public @ 2023-04-29 02:50:12

更多您感兴趣的搜索

2.768616s