sogou spider 如何反应我网站上页面的更新?
sogou spider 会根据网页的重要性和历史变化情况来动态调整更新时间,更新已经抓取过的页面。
Public @ 2010-06-23 15:38:49
sogou spider 会根据网页的重要性和历史变化情况来动态调整更新时间,更新已经抓取过的页面。
因为搜索引擎索引数据库的更新需要时间。虽然Baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要数月时间才会清除。另外也请检查您的robots配置是否正确。如果您的拒绝被收录需求非常急迫,也可以通过 投诉平台 反馈请求处理。
如此 实际上,搜索引擎蜘蛛抓取越多并不一定是越好的。这取决于您的网站是做什么的。如果您的网站有重要的动态内容,那么如果您的搜索引擎蜘蛛抓取过多,将会给您的网站带来压力,导致网站性能和速度下降。如果您的网站是基于静态内容的,例如博客,则搜索引擎蜘蛛抓取更多是没有问题的。
sogou spider 支持 robots 协议,您可以在网站的根目录放置 robots.txt。robots.txt 的规则请参阅 http://www.robotstxt.org/。需要注意的是,最新更新的 robots.txt 可能需要几个星期才能体现出效果来,另外,被您禁止 sogou spider 收录的网页将不能在搜狗搜索引擎上检索到。
搜狗是一家中国的互联网公司,旗下拥有搜狗搜索引擎。蜘蛛爬虫是搜索引擎中用来抓取网页内容的程序。搜狗搜索的蜘蛛爬虫被称为"Sogou web spider"。 蜘蛛爬虫抓取网页的过程中,会按照一定的规则遍历网页,获取网页的内容并存储在搜索引擎的数据库中,以便用户在搜索时能够得到相应的结果。 如果你想了解搜狗搜索的蜘蛛爬虫抓取的更多细节,可以查阅搜狗搜索的官方技术文档,或者参考相关的网络资源和教程