Categories


Tags


如何用程序识别Baiduspider ua

近日 ,Baiduspider针对移动抓取user agent(以下简称ua)进行了升级,与PC端的抓取ua做到版本统一,均称为Baiduspider/2.0。从此次更新的移动ua和PC ua来看,不管是移动ua还是PC ua都包含有关键字Baiduspider,我们可以由此判断访客ua是不是来自百度。与PC ua不同的是,移动ua包含有关键字android和mobile,再通过这两个关键字,我们就可以识别出来访的访客ua是移动ua还是pc ua。

通过以上判断逻辑,我们可以很容易判断出来访的ua类型。下面是如何通过主流的php和asp语言来判断来访的ua类型。

php版:

<?php

$ua=$_SERVER['HTTP_USER_AGENT'];

$ua=strtolower($ua);

if($ua!="" &&strpos($ua,"baiduspider")){

if(strpos($ua,"android") || strpos($ua,"mobile")){

echo "是百度移动UA";

}else{

echo "是百度PCUA";

}

}else{

echo"不是baiduspider UA";

}

?>

asp版:

<%

ua=Request.ServerVariables("HTTP_USER_AGENT")

ua=LCase(ua)

if ua<>"" andInStr(ua,"baiduspider")<>0 then

ifInStr(ua,"android")<>0 or InStr(ua,"mobile")<>0then

response.write "是百度移动 UA"

else

response.write"是百度PC UA"

endif

else

response.write "不是baiduspiderUA"

end if

%>

以上demo可以用来简单判断来访ua是否是Baiduspiderua,以及是什么类型的ua,在实际使用过程中,请稍加修改后使用。

如果同学们针对文章中的内容还有疑问的话,欢迎来到【学堂同学汇】讨论专帖进行留言讨论。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2016-12-20 15:38:45

sogou spider User-Agent字段是什么?

Sogou spider User-Agent字段是一种用于爬虫程序中的HTTP报头,它是搜狗搜索的爬虫程序使用的字符串,其格式为:"Sogou web spider/版本号(语言:语言代码;平台:操作系统)",例如:"Sogou web spider/4.0(Windows NT 6.1;zh-CN)"。该字段包含了爬虫程序的名称、版本号、语言和操作系统等信息。

Public @ 2023-05-26 16:50:07

网络爬虫(Spider)

网络爬虫(Spider)是一种自动化程序,用于通过互联网收集和抓取网页信息。它模拟人类在浏览器中的操作,自动访问网站并抓取其中的信息。爬虫的主要作用是帮助用户快速地获取海量数据,例如网页内容、图片、音频、视频等,并将它们存储在一个本地数据库中,以供后续处理和分析。在人工获取数据耗时费力的情况下,网络爬虫的应用可以大大提高数据抓取效率,以及提高数据处理的准确与可靠性。

Public @ 2023-06-02 04:00:09

百度spider介绍

1. 什么是BaiduspiderBaiduspider是百度搜索引擎的一个自动程序,它的作用是访问互联网上的网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站上的网页。2. Baiduspider的user-agent是什么?百度各个产品使用不同的user-agent:产品名称对应user-agent网页搜索Baiduspider无线搜索Baiduspider图片搜索Baiduspide

Public @ 2022-01-17 15:38:44

BaiDuSpider百度蜘蛛占用流量,robots.txt设置

注:以下BaiDuSpider等于百度蜘蛛、Googlebot等于google蜘蛛、Sogou Spider等于搜狗蜘蛛一、问题因某些原因,搜索引擎蜘蛛抓取网站占用很大流量,如图:网站访问日志也可看见很多蜘蛛爬行记录。如果是正常的搜索引擎蜘蛛访问,不建议对蜘蛛进行禁止,否则网站在百度等搜索引擎中的收录和排名将会丢失,造成客户流失等损失。可以优先考虑升级虚拟主机型号以获得更多的流量或升级为云服务器(

Public @ 2009-04-20 15:56:40

更多您感兴趣的搜索

0.514386s