sogou spider 喜欢收录什么样的页面
- 威海Spider 威海sogou spider
- 1321
内容优良而独特的页面。如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。
链接层次较浅的页面。过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
如果是动态网页,请控制参数的数量和URL的长度。搜狗更偏好收录静态网页。重定向次数越多的页面,越有可能被 sogou spider 丢弃。
来源:搜狗资源平台
内容优良而独特的页面。如果您的页面内容和互联网上已存在的其他页面有高度的相似性,可能不会被 sogou spider 收录。
链接层次较浅的页面。过深的链接层次,尤其是动态网页的链接,会被丢弃而不收录。
如果是动态网页,请控制参数的数量和URL的长度。搜狗更偏好收录静态网页。重定向次数越多的页面,越有可能被 sogou spider 丢弃。
来源:搜狗资源平台
我的网站显示的蜘蛛抓取,有好多动态链接是否有影响?是否需要处理。该如何处理?11-29.123.如果不是自己网站本身实际存在的url,很可能是网站由于被人刷,导致的。对应这些动态链接,可以在robots文件中,写一个屏蔽抓取动态链接的语法。User-agent: *Disallow: /*?*更详细的robots设置方法,可以看下面链接课程https://ke.seowhy.com/play/94
sogou spider遵守互联网meta robots协议。您可以利用网页meta的设置,使搜狗显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,虽然您已经在网页中通过meta禁止了搜狗在搜索结果中显示该网页的快照,但搜狗搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。
sogou spider 会根据网页的重要性和历史变化情况来动态调整更新时间,更新已经抓取过的页面
虽然您在网站上加了robots.txt文件,但搜狗搜索引擎仍然可以在搜索结果中显示您的网站。这是因为robots.txt文件只是一个标准化的协议,它主要用于指导搜索引擎爬虫(蜘蛛)如何访问和索引网站的内容。 尽管大多数搜索引擎都会遵循robots.txt文件中的规则,但有些搜索引擎可能会选择忽略它或解释不同的方式。这可能是因为搜狗搜索引擎没有完全遵循robots.txt文件的指示,或者由于其他原