Categories


Tags


百度搜索资源平台如何使用API推送功能

1,需要网站制作数据推送接口,进入API推送工具后,会看到接口调用地址的token,token是由16个英文数字组合的字符串

2,下面提供一些推送示例

1)curl推送示例

将要提交的url数据写入一个本地文件,比如urls.txt,每个url占一行,然后调用curl命令:

curl -H 'Content-Type:text/plain' --data-binary @urls.txt

"http://data.zz.baidu.com/urls?site=www.example.com&token=edk7yc4rEZP9pDQD"

使用php、python、java等可以参照这个过程推送结构化数据。

2)post推送示例

POST /urls?site=www.58.com&token=edk7ychrEZP9pDQD HTTP/1.1

User-Agent: curl/7.12.1

Host: data.zz.baidu.com

Content-Length: 83

http://www.example.com/1.html

http://www.example.com/2.html

3)php推送示例

$urls = array(

'http://www.example.com/1.html',

'http://www.example.com/2.html',

);

$api = 'http://data.zz.baidu.com/urls

site=www.58.com&token=edk7ychrEZP9pDQD';

$ch = curl_init();

$options =  array(

CURLOPT_URL => $api,

CURLOPT_POST => true,

CURLOPT_RETURNTRANSFER => true,

CURLOPT_POSTFIELDS => implode("\n", $urls),

CURLOPT_HTTPHEADER => array('Content-Type: text/plain'),

);

curl_setopt_array($ch, $options);

$result = curl_exec($ch);

echo $result;

4)ruby推送示例

require 'net/http'

urls = ['http://www.example.com/1.html', 'http://www.example.com/2.html']

uri = URI.parse('http://data.zz.baidu.com/urls

site=www.xxx.com&token=eTk7ychrWZP1pDQD')

req = Net::HTTP::Post.new(uri.request_uri)

req.body = urls.join("\n")

req.content_type = 'text/plain'

res = Net::HTTP.start(uri.hostname, uri.port) { |http| http.request(req) }

puts res.body

如何查看推送反馈

您可以通过推送后返回的状态码和字段来判断数据是否推送成功。

1,状态码为200,表示推送成功,可能返回以下字段:

字段

是否必选

参数类型

说明

success

int

成功推送的url条数

remain

int

当天剩余的可推送url条数

not_same_site

array

由于不是本站url而未处理的url列表

not_valid

array

不合法的url列表

成功返回示例:

{

"remain":4999998,

"success":2,

"not_same_site":[],

"not_valid":[]

}

2,状态码为4XX或500,表示推送失败,返回字段有:

字段

是否必选

类型

说明

error

int

错误码,与状态码相同

message

string

错误描述

常见的推送失败返回示例说明:

error

message

含义

400

site error

站点未在站长平台验证

empty content

post内容为空

only 2000 urls are allowed once

每次最多只能提交2000条链接

over quota

超过每日配额了,超配额后再提交都是无效的

401

token is not valid

token错误

404

not found

接口地址填写错误

500

internal error, please try later

服务器偶然异常,通常重试就会成功

API推送功能常见问题

1, 和原来的sitemap提交接口有什么区别?

答:状态反馈更及时了,原来提交后需要登录到搜索资源平台查看提交是否成功。目前只要根据提交后返回的数据就可以判断了。

2, 已经存在的提交sitemap数据的程序代码需要做什么修改?

答:主要修改两点。第一点,提交的接口需要修改;第二点,需要处理下接口返回的信息,失败后需要根据错误进行相应处理,报错的链接是无法提交成功的

3,为什么提交成功后看不到数据变化?

答:我们反馈的是新提交链接的数量,如果您提交的链接在之前提交过(即重复提交)是不会被统计到的

4,在什么时机使用API推送提交功能效果最明显?

答:页面链接产生或发布时立即提交,这样效果是最好的

5,每次提交一条数据和多条数据有什么区别?

答:没有区别

6,重复提交已经发布的链接会有什么问题?

答:会有两个影响。第一,将浪费您提交的配额,每个站点每天可提交的数量是有限制的,如果您都提交了旧链接,当有新链接时可能因为配额耗尽无法提交。第二,如果您经常重复提交旧链接,我们会下调您的配额,您可能会失去API推送功能的权限

7,API推送可以推多少条链接?

答:API推送可提交的链接数量上限是根据您提交的新产生有价值链接数量而决定的,百度会根据您提交数量的情况不定期对上限额进行调整,提交的新产生有价值链接数量越多,可提交链接的上限越高。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2017-02-21 16:02:30

一张图看懂收录与索引的区别

在过去的一段时间里,大家一度对收录和索引的概念非常模糊,百度工程师也曾“粗暴”地说过“收录和索引是一回事”。但实际工作中,院长发现,其实收录和索引都有其各自的重要意义,并不能含糊地混为一谈,于是制作了这样一张图,让大家快速了解收录与索引的区别。1,收录和索引分别指什么收录:页面被Baiduspider发现、分析过索引:Baiduspider经初步分析后认为有意义,做建库处理2, 收录和索引的关系包

Public @ 2021-05-28 15:34:45

百度搜索资源平台-Robots

使用说明1. robots.txt可以告诉百度您网站的哪些页面可以被抓取,哪些页面不可以被抓取。2. 您可以通过Robots工具来创建、校验、更新您的robots.txt文件,或查看您网站robots.txt文件在百度生效的情况。3. Robots工具目前支持48k的文件内容检测,请保证您的robots.txt文件不要过大,目录最长不超过250个字符。4. 如需检测未验证站点的robots设置,请

Public @ 2020-03-13 16:06:47

【技术支持】多headline功能使用说明

多headline功能是一种可以让你在一篇文章中使用多个标题的功能。这种功能非常有用,可以帮助你在一个文章中描述多个不同的主题或者讨论点。 在使用多headline功能时,你需要注意以下几点: 1. 确定使用的文本格式:多headline功能需要在指定的文本格式下使用才能正确地展示。常用的格式包括Markdown或者HTML等。 2. 使用正确的标签:在使用多headline功能时,你需要使

Public @ 2023-03-28 18:50:26

百度搜索上线关于补充站点名称的公告

百度搜索发布了关于补充站点名称的公告: 根据用户反馈和持续优化搜索的需要,百度搜索即日起支持用户在搜索结果中补充站点名称。 补充站点名称功能可以让用户对搜索结果中出现的某个页面,特别是品牌、机构或知名网站的某个页面进行站点名称的补充,提高了搜索结果的准确性和用户体验。同时对于站长来说,可加强品牌的认知和展现。例如,用户在搜索“百度”时,能够通过补充站点名称的方式明确表示想要查询百度知道或者百度

Public @ 2023-06-20 10:00:14

更多您感兴趣的搜索

0.532617s