Categories


Tags


CDN对网站在搜索引擎中的影响

近期平台社区策划了一场关于网站该不该用 CDN 的大讨论,77.43%的用户都认为应该用,但是一部分用户纠结于如果用了 CDN 之后对于搜索引擎会不会产生负面的影响。学堂结合百度 spider 工作原理以及百度工程师建议,整理文章如下,供广大站长学习:

CDN能够使用户可就近取得所需内容,解决 Internet网络拥挤的状况,提高用户访问网站的响应速度。那么对搜索引擎有什么影响呢?

首先我们看下社区用户的看法

【正方观点】

1、 提升网站加载速度:CDN通过缓存技术提升网站打开速度,便于蜘蛛快速抓取和爬行

2、 提升网站安全性:隐藏真实网站ip,防御针对服务器IP的攻击和各种探测扫描,避免被黑

3、 提升网站稳定性:CDN的ip遍布全国,如果出现局部地区网络问题,不会影响搜索引擎抓取

4、 提升网站用户体验:CDN提升用户的打开体验,对提升排名也有一定的作用

【反方观点】

1、抓取数据下降:CDN ip的多样性,部分ip可能对蜘蛛并不友好;

2、缓存导致数据陈旧:CDN的缓存特性,导致部分地区可能内容更新不同步;

3、服务商优劣参杂:因为服务商的实力不同,可能会导致CDN系统不稳定,反而产生负面影响

4、本地网站无需CDN:部分网站只服务本地,只要机房也在本地,无需使用CDN;

综合双方观点来看,大家的争议点主要集中在CDN的多ip入口和缓存机制会不会对搜索引擎抓取、网站排名产生不利影响。

从搜索抓取机制上讲:Baiduspider对站点的抓取方式和普通用户访问一样,只要普通用户能访问到的内容,我们就能抓取到。不管是用什么技术,只要能保证用户能流畅的访问网站,对搜索引擎就没有影响。而缓存技术提升了打开速度和用户体验,这也是百度搜索引擎一直所倡导的,那么为什么还是有一些网站使用CDN后产生了负面影响。

我们对百度工程师进行了相关咨询,主要有两方面的因素:

一是部分CDN服务商硬件投入不够,经常出现不稳定情况,导致蜘蛛返回大量503内容,导致了抓取量的下降,有的甚至影响了索引量的影响;所以选择有实力的CDN服务商很重要!

二是缓存机制在网站出现死链、无法打开、被黑等情况的时候起到了推波助澜的作用。短时间内产生了一些不利快照,影响了排名。但是这种情况不用担心,及时清理源文件和CDN缓存,并在站长平台提交相关死链数据等方法进行挽回,是可以恢复到原来的情况的!

参考资料:以下内容由百度开放云提供

网站要不要用CDN?

画了一张朴(很)素(low)的图帮助大家来了解业务是否适合使用CDN

以静态请求来说,流量命中率越高的业务越适合用CDN,这时成本越低,加速效果越好

以动态请求来说,一般不适合用CDN,经过CDN会增加链路的时间开销。除非CDN有动态加速功能保证CDN的链路选择最优。这种情况下选择使用动态加速功能,带来的好处是源站只需要单线部署,由CDN实现更复杂网络的接入。

注:流量命中率=(((CDN出流量-发生回源的出流量)/CDN出流量)*100)%

画了一张朴(很)素(low)的图帮助大家来了解什么是流量命中率,这是CDN非常重要的一个指标,流量命中率越高意味着加速效果越好,花的钱越少

也许这时候你会问我的内容是静态的也很hot,那我是否就一定要用CDN了呢。答案是不一定。还有一个至关重要的因素是成本。CDN的成本降低是在最大化保证用户体验的情况下成本最优(好拗口)

简言之对于一些对成本非常敏感,不追求极致的用户体验的公司,CDN未必是一个好的选择。

举个栗子,一个小型的创业游戏公司使用CDN的主要场景的是游戏下载,由于处于创业阶段,对成本非常敏感,同时认为在当前阶段下可以牺牲用户体验,他们最终并没有选择使用CDN,而是直接购买了1Gbps的带宽并进行限速,这样的选择是他们的成本从每月12万元左右降低到5万元左右。但是CTO也坦言这是特殊阶段不得不做出牺牲用户体验的选择,后面仍然会考虑使用CDN。

结论:如果您要保证网站访问体验最优化,网站访问很热的静态内容是非常适合使用CDN的。

1. 提升访问速度

使用CDN后全国的访问速度-平均传输速度5.76MB/s

使用CDN前全国访问速度-平均下载速度590KB/s

2. 降低带宽成本

前面提到,在保证访问效果最优的情况下,使用CDN降最大程度的降低带宽成本和人力维护成本

3. 减轻源站压力

使用CDN以后,一个带宽峰值100Gbps左右的大型站点基本只需要维护带宽峰值在1~2Gbps左右的源站即可。

4. 隐藏源站,增强源站抗攻击能力

由于CDN隐藏了源站的真实IP以及CDN天然的抗攻击能力,使用CDN后,源站的安全性会大幅提升

来源:百度搜索资源平台 百度搜索学堂


Public @ 2014-02-24 15:26:10

深入解读跳出率

跳出率是指当用户访问网站时只浏览了一个页面后就离开的比例。跳出率是衡量用户行为非常重要的指标,能反应出用户是否对这个页面或网站感兴趣。但跳出率并不是衡量网站质量的唯一指标。在分析跳出率之前,我们应该首先分析网站属于什么类型,一般情况下工具类型的网站跳出率否非常高,用户进入页面后只是使用工具来做某项工作,完成后就会关闭。而以下理解的跳出率才是合理的(单纯地分析跳出率的数值没有什么意义):a、很多用户

Public @ 2020-06-28 16:18:48

Google技术副总裁谈Google排名算法

作为一位AI助手,我可以向您提供以下Google技术副总裁的观点: Google技术副总裁Matt Cutts曾经表示,Google的排名算法是由多个因素组成的复杂算法,这些因素包括页面内容、页面上的关键词、链接质量、网站访问速度等。其中,内容和链接质量是最重要的因素之一。 谈到如何提高网站排名,Matt Cutts建议网站拥有优质、有用且与主题相关的内容,并通过合法的方式获取高质量的链接。他

Public @ 2023-06-14 08:50:24

使用CDN后,获取真实IP办法 (127.0.0.1)

当使用CDN时,客户端的请求实际上是被CDN服务器代理所执行的,因此当客户端通过CDN服务器访问你的应用程序时,你的服务器将无法直接获取客户端的真实IP地址。如果你需要获取客户端的真实IP地址,则需要采取以下几个步骤: 1. 通过CDN服务商的API获取真实IP地址 某些CDN服务商(例如CloudFlare)允许你通过API获取客户端的真实IP地址。你可以通过调用这些API将客户端的真实IP

Public @ 2023-04-20 14:50:23

CDN对网站在搜索引擎中的影响

近期平台社区策划了一场关于网站该不该用 CDN 的大讨论,77.43%的用户都认为应该用,但是一部分用户纠结于如果用了 CDN 之后对于搜索引擎会不会产生负面的影响。学堂结合百度 spider 工作原理以及百度工程师建议,整理文章如下,供广大站长学习:CDN能够使用户可就近取得所需内容,解决 Internet网络拥挤的状况,提高用户访问网站的响应速度。那么对搜索引擎有什么影响呢?首先我们看下社区用

Public @ 2014-02-24 15:26:10

更多您感兴趣的搜索

0.460515s