Categories


Tags


我希望我的网站内容被百度索引但不被保存快照,我该怎么做?

Baiduspider遵守互联网meta robots协议。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。

和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。


Public @ 2016-03-31 15:56:46

百度搜索结果泄露个人隐私,或造成个人伤害,如何删除这类不良信息。

如果百度搜索结果中包含了你的个人隐私或可能对你造成伤害的不良信息,你可以尝试以下几种方法来删除它们: 1. 直接联系网站管理员:找到包含不良信息的网站,尝试找到他们的联系方式,如网站的“联系我们”或“投诉”页面。向网站管理员说明情况并请求删除不良信息。 2. 使用百度搜索引擎提交删除请求:你可以使用百度搜索引擎的“删除网页信息”工具,提供不良搜索结果的URL和相关理由进行提交。百度会评估请求的

Public @ 2023-07-29 00:50:35

屏蔽百度爬虫的方法

在百度C2C产品“百度有啊”即将上线的时候,淘宝网站曾经屏蔽百度搜索爬虫,禁止百度搜索引擎抓取淘宝网站的网页内容,淘宝官方的解释是“杜绝不良商家欺诈”。在技术层面,淘宝屏蔽百度的方法是,在网站的robots.txt文件中加上如下内容:User-agent: BaiduspiderDisallow: /但实际上这种方法并不能完全屏蔽百度的爬虫,至今在百度上输入site:taobao.com还是可以看

Public @ 2012-08-15 15:56:41

BaiDuSpider百度蜘蛛占用流量,robots.txt设置

在网站根目录下的 robots.txt 文件可以用来告诉搜索引擎蜘蛛(包括百度蜘蛛)哪些页面可以访问,哪些页面不可访问。通过设置 robots.txt 文件,可以控制蜘蛛的爬取范围,减少不必要的流量消耗。 以下是一个提供给百度蜘蛛的 robots.txt 示例: ``` User-agent: Baiduspider Disallow: /path/to/disallowed/page.htm

Public @ 2023-07-28 12:00:44

更多您感兴趣的搜索

0.535287s