Categories


Tags


Google技术副总裁谈Google排名算法

今天是Google新闻发布日2006,大家可以看新闻发布会的实况,长达3个多小时。在发布会上Google总裁Eric Schmidt谈到Google的核心还是搜索,相关人员介绍了四个新产品,其中Google Trend对关键词研究很有用。

最感兴趣的是Google技术部门副总裁Alan Eustace谈Google排名的情况。所以我只跳到这个部分看了一下,大概半小时。下面拣记得的重点介绍给大家。

Alan首先谈到的是蜘蛛爬行,基本上就是跟踪所发现的链接。

速度非常重要。上一次Google在主页上发布的信息是,在数据库中有80亿网页。如果每秒爬行一个网页的话,这80亿的网页需要250多年才能爬行完。所以高速爬行网页非常重要。

爬行时的另外一个问题是,大概有50%的网页都是重复内容。所以Google所收录的80亿其实是已经丢掉了一半后的数字,真正爬行的有可能是200亿文件。

爬行时还有一个危险就是无限循环。比如说跟踪某个网页上日历的链接,可能在这个日历上总是有“下一个月”这个按钮,产生无限循环。因为网页程序可以无限制的生成下一个月的月历,Google蜘蛛就出不来了。

10%到20%的网站每个月都会更新内容,更新度也很重要。

然后是索引,索引就和一本书的索引差不多。比如说用户搜索heart attack(心脏病暴发),heart出现在文件5,9,25,attack出现在文件7,9,22,那么很明显第九个网页是符合条件的网页,这样搜索范围就已经限制在包含搜索词的网页内。

当然这个数量还是巨大的,再怎么从这里面挑出最好的结果呢?也就是进一步计算排名。

Google用两百多个信号来计算排名,这是新信息。

Alan提到了锚文字和PageRank。

举斯坦弗大学网页作为例子,很多其他网站会连向斯坦弗大学的网页,那么可以合理假定斯坦弗大学的网站权威性比较高,这也就是PR的意义。

然后是锚文字,也就是链接文字。比如在斯坦弗大学的网页上,一个以“Knight fellows”为链接文字的链接到其他网站,那么这个链接文字本身就在一定程度上说明了那个网页的主题,就算在那个网页上面Knight fellows这个词根本没有出现。

这个排名过程必须是自动的,不可能人工去调节这些排名。

Alan谈到大约20%到25%的搜索关键词都是独特的,也就是说以前从来没有别人所搜索过的。用户都非常有创意,会以各种各样形式组合的词来做搜索。

一个关键词搜索是由上千架机器所处理的。

Alan接着谈到垃圾技术,比如说在留言本里留下垃圾链接,这种技术对Google来说早就不起作用了。再比如有的作弊的人建立大量的网站,在这些网站之间互相链接,这对Google也不起作用。

他加了一句:对别的搜索引擎起不起作用,那就不知道了。

Google在做算法调整的时候,依据是多少人受益。比如说做某个调整,40%的人会觉得搜索质量提高,40%的人觉得没什么变化,20%的人觉得搜索质量降低,Google的决定就会是进行这个调整。

不可能在100%的搜索词下满足100%的人。

Alan还提到很多其他语言的搜索也非常困难,比如中文分词技术。

这段谈话倒没有很出人意料的地方,但Google负责技术的副总裁自己谈Google排名算法就已经很难得了。

等有时间再完整看一遍,看有什么新东西。

来源:SEO每天一贴 Zac 昝辉


Public @ 2010-05-24 15:30:10

一个关于Google排名的有趣问题

转眼间博客已经整整一年没更新了。为了不要让SEO每天一贴变为多年一贴,在刚好一年的时候更新一下。今年简直是世界大乱,虽然各个事件会以怎样的方式结束还不知道,但可以肯定的是,对世界、对国家、对个人,都有方向性的巨大影响,影响大到想对世界、对人生发些感慨,都不知道从何说起了。所以还是回到seo这个小话题吧。前几天一位国内某大型电商SEO部门的朋友问我些问题,其中一个很有意思,一两句话又说不清楚,所以写

Public @ 2012-09-25 15:54:44

主机是否会影响搜索排名

选择虚拟主机或服务器是建设网站很重要的一步,这个重要性主要指的是主机可靠性,速度,功能等。主机的选择对SEO排名有什么影响呢?总体上说,只要主机设置没有错误,对搜索引擎排名影响不大,但也有几个地方值得注意。主机故障可能造成无法抓取搜索引擎蜘蛛在来访你的网站的时候,如果主机死了,无法打开网页的话,搜索引擎也并不会马上把这一页删除,一般搜索引擎蜘蛛都会过一段时间再来索引。所以只要你的主机不要连续十天半

Public @ 2019-01-16 15:25:57

Google 2019年3月核心算法更新

本来不想谈Google的这次2019年3月核心算法更新,因为昨天在 Google算法更新大全帖子里已经加上了这次更新的内容。但读者ailly问了这个问题:哈罗 Zac 您好!3.12这次的Google算法对于网站有什么影响呢。还是持续去年8月份的更新,更多的应该专注于构建优质内容上面吗?我们公司做软件的,主要市场是国外,对于这次更新,面向西语、英语等欧美国家网站排名有很大影响、但是对于面向日本的网

Public @ 2022-05-28 15:54:43

Matt Cutts谈总体搜索质量和新的基础架构

Matt Cutts在谷歌的一次采访中谈到了总体搜索质量和新的基础架构的问题。 他认为,谷歌一直在不断改进其搜索算法和质量评估方法,以便能够更好地为用户提供相关的搜索结果。此外,谷歌还在研究和改进搜索结果的呈现方式,使它们更易于理解和使用。 除此之外,Matt Cutts还提到了谷歌正在开发一种新的基础架构,以更好地支持其搜索和其它服务。这个新的基础架构将采用更先进的技术和系统,以提高谷歌的性

Public @ 2023-06-12 07:00:21

更多您感兴趣的搜索

0.454641s