Categories


Tags


百度对HTTPS站点全流程支持方案文字概述

5月25日,VIP大讲堂-网站安全那些事儿成功举办,现场发布百度对HTTPS站点全流程支持方案,收到站长们广泛关注!学堂君贴心的将现场演讲提炼成文字版本带给大家,快来看吧!

HTTPS优势

HTTPS是基于tls和ssl加密的HTTP协议,网络传输是加密的,因此它的安全是显而易见的,包括防窃听、篡改、劫持。

HTTPS的收录机制

1、Spider如何发现HTTPS

1)、根据网页中的超链接是否是HTTPS,网络中会有一些超链,如果是HTTPS会认为是HTTPS站点。

2)、根据站长平台提交入口的提交方式,例如主动提交,如果在文件当中提交的是HTTPS链接会以HTTPS的形式来发现。

3)、参考前链的抓取相对路径,第一个网页是HTTPS的,网站内容里面的路径提供的是相对路径,会认为这种链接是HTTPS。

4)、参考链接的历史状况,使用这种方式的原因主要是为了纠错,如果错误提取HTTPS会遇到两种情况,一种因为HTTPS不可访问会抓取失败,第二即使能抓成功可能展现出来的可能不是站长希望的,所以会有一定的纠错。

2、HTTPS链接的抓取

现在比较常见的两种,第一种是纯HTTPS抓取,就是它没有HTTP的版本,第二个是通过HTTP重定向到HTTPS,这两种都能正常的进行抓取跟http抓取的效果是一样的。

3、HTTPS的展现

对于HTTPS数据,展现端会有明显的提示

站长平台支持全站HTTPS配置

1、HTTPS配置

之前有一些站长改HTTPS,会疑问为什么站点有些链接是以HTTP的形式来抓呢?为什么没有全站都是以HTTPS的形式来抓取呢?因为以前的机制是url级的,HTTPS抓完一条替换一条,整站需要全抓完才能全部替换掉,现在大家访问站长平台可以发现,左边工具栏多了HTTPS认证的功能,站长平台已经全站支持HTTPS,点这个功能后会有提示引导我们去怎么做,需要提醒是需要全站支持HTTPS,才进行点击,如果不支持的话对站点会有一些副作用。

2、HTTPS验证

当站长在平台上做了配置以后首先会有HTTPS验证,验证确认站长是否误配,具体会检查HTTPS链接是不是可抓取的。另外会对HTTPS的证书校验,包括它的合法性、是否过期、跟它本身的域名是否一致,从这三个角度做校验。

3、HTTPS生效

校验通过后,生效方式从这三个角度进行

1)、全站抓取以HTTPS的方式来抓,这会在抓取上做一定的切换

2)、全站的展现样式也会直接切换成HTTPS,用了这个功能的好处是会比以前快很多,会略过已收录的网页直接到HTTPS。

常见问题:

1、站长升级HTTPS是不是会影响爬虫抓取?不会。爬虫对HTTPS的合法链接都能抓

2、站长升级HTTPS是不是会影响索引量?不会的,建库做了相应升级,HTTPS的建库是不会有延迟的。

3、站长升级HTTPS是不是会影响排名点击流量?不会,HTTPS改造是不涉及到域名切换,或者说老域名到新域名样式的转变等等这个是不涉及的,可以做到完全无损的切换。

4、站长升级的HTTPS是不是会影响移动适配?不会有这种情况。

5、站长升级HTTPS是不是会影响站长平台工具?不会,站长平台链接提交等工具已经都支持HTTPS了。

站点建议

1、建议站长从HTTP到HTTPS的301跳转,不建议只有HTTPS,而无HTTP到HTTPS的跳转关系,只用HTTPS访问对用户来说,可能会遇到问题。

2、不建议HTTPS、HTTP这两种版本并存,这种情况存在三种问题,第一个它的维护成本比较高,需要维护两个版本;第二个做不到绝对安全,HTTP访问有不安全风险;第三有不一致的可能性,随着长远的发展这两个版本可能会越来越不一致,会影响用户体验,我们建议站长做了HTTPS之后能对HTTPS做一定的跳转预设。

3、HTTPS回退到HTTP极不建议。例如线上已经展示HTTPS的链接给用户点击,如果站长回退到HTTP,用户在浏览器里面点开的时候会展现死链的样式是非常不建议的,做这个之前一定考虑。如果实在想做回退,请在站长平台提交HTTPS校验,并建议站点提前至少24小时在平台提交回退,这样能够保证站长的点击不会出现死链的形式,这点非常重要。

4、HTTPS网页没有建设完成之前不要在互联网上提供超链接,之前遇到过好几个case,本身HTTPS并没有做完,两个版本都存在,但是http是用户可访问的,或者说HTTPS的页面是一个临时性的假页面,这样站点有可能就以HTTPS的形式展现出来,会引起用户体验问题。

来源:百度搜索资源平台 百度搜索学堂


Public @ 2009-04-01 15:35:49

搜索公开课复盘之《时效性解读》

上周五,百度搜索线上公开课如期和大家见面,百度搜索产品经理谢其扬从三个方面:什么是时效性、时效性在百度搜索中的重要性以及如何判断时效性,为开发者们详细解读了时效性的相关内容。本小鱼对“时效性解读”公开课进行了一场复盘,课程重点、难点、案例...你想了解的都在这里,快来看看吧~一、什么是时效性?1、时效性是指用户对搜索结果新旧程度的感知。2、时效性的重要性:对于用户来说:在满足需求的前提下,用户天然

Public @ 2013-03-12 15:22:09

从百度取消referer关键词说起

百度宣布全站https后,搜索资源平台又抛出重磅炸弹:百度将逐步取消百度referer关键词显示,引发站长热议。其实在百度搜索资源平台的消息放出之前,已经有敏感的站长从日志中发现了端倪,并对百度此举进行了准确预测。现在消息正式颁布后,很多站长都对此表现了看法,学堂选择了其中一篇进行分享,但由于内容比较敏感,作者不愿透露自己的姓名,遗憾之余我们希望这位朋友今后可以在学堂进行更多分享,和大家一起成长。

Public @ 2011-08-31 15:35:53

HTTPS的收录机制是什么?

HTTPS(全称为Hypertext Transfer Protocol Secure)是一种安全的、基于HTTP的传输协议,主要用于用户与网站之间传输数据或进行安全登录等操作。HTTPS 的收录机制主要是利用 HTTPS 协议,将网页内容加密传输,搜索引擎就能索引到 HTTPS 站点的网页链接信息;而当爬虫抓取数据时,它会进行浏览器模拟从而获取网页信息。

Public @ 2023-03-01 06:00:13

【官方说法】HTTPS改造,302也可以接受啦!

之前HTTPS改造中提过,要求做了HTTPS的网站,建议保留HTTP站点48小时,且将HTTP站点301到HTTPS站中,而且是必须301才可以。现在,HTTPS认证工具升级,HTTP站点301或者302到HTTPS站点都可以了,两种跳转方式都可以识别。再来回顾一下,如果网站做了HTTPS协议,站长可使用HTTPS认证工具,帮助百度搜索快速识别并收录HTTPS站点,使用HTTPS认证工具,需要注意

Public @ 2013-10-16 15:35:52

更多您感兴趣的搜索

0.431975s