Categories


Tags


李彦宏超链分析专利,超链分析算法的作用

互联网上的信息非常的庞大,要想让用户搜索到精准信息是很难的。搜索引擎技术非常复杂。百度创始人李彦宏在创立百度之前就已经是国际上比较厉害的搜索引擎技术专家了。据说李彦宏在找风险投资时,投资人询问了三个搜索引擎界的技术牛人一个同样的问题:要了解搜索引擎技术应该找谁,其中两个人回答说找李彦宏,由此投资人就断定李彦宏是最了解搜索引擎的人之一。

李彦宏超链分析示意图

这其实就是现实生活中链接关系的应用:要判断哪个人或网页最具权威性,不能光看这个人或网页,自己怎么说,还要看其他人对这个网页怎么评价。超链分析的基本原理是在某次搜索的所有结果中,被其他网页用超链指向得越多的网页,其价值就越高,就越应该在结果排序中排名越靠前。

超链分析是一种引用投票机制,对于静态网页或者网站主页,它具有一定的合量性,因为这样的网页容易根据其在互联网上受到的评价产生不同的超链指向量,超链分析的结果可以反映网页的重要程度,从而给用户提供出更重要、更有价值的搜索结果。

李彦宏1997年就提交了一份名为“超链文件检索系统和方法”的专利申请,这比Google创始人发明PR要早得多,不得不说这是非常具有前瞻性的研究工作。在这份专利中,李彦宏提出了与传统信息检索系统不同的基于链接的排名方法。

这个系统除了索引页面之外,还建立一个链接词库,记录链接锚文字的一些相关信息,如锚文字中包含哪些关键词,发出链接的页面索引,包含特定锚文字的链接总数,包含特定关键词的链接都指向哪些页面。词库不仅包含关键词原型,也包含同一个词千的其他衍生关键词。

根据这些链接数据,尤其是锚文字,计算出基于链接的文件相关性。在用户搜索时,将得到的基于链接的相关性与基于关键词匹配的传统相关性综合使用,得到更准确的排名。

超链分析就是通过分析链接网站的多少来评价被链接的网站质量,这保证了用户在百度搜索时,越受用户欢迎的内容排名越靠前。在今天看来这种基于链接的相关性计算是搜索引擎的常态,每个SEO人员都知道。但是在十七八年前,这无疑是非常创新的概念。百度CEO李彦宏就是超链分析专利的唯一持有人,目前该技术已为世界各大搜索引擎普遍采用。当然现在的搜索引擎算法对链接的考虑,已经不仅仅是锚文字,实际上要复杂得多。但是大量精准有效的外链是提高目标关键词排名的重要因素。在优化网站关键词排名的时候高权重的外部链接还是非常重要的。


Public @ 2020-01-04 15:39:01

HITS算法

HITS算法是一种采用迭代计算的网络算法,用于计算网络中节点的权重。该算法主要用于网络信息检索等计算技术。HITS算法与传统的关键词检索不同,关键词检索是以词语为基础,以文档为主要检索对象,结果通过匹配检索关键词的文档及其相关性程序来返回结果。而HITS算法则是以链接为基础,以网页为主要检索对象,通过计算每个页面的被链接的频度和链接其它页面的重要程度来决定查询结果的排序。该算法基于“authr

Public @ 2023-02-25 06:01:28

PageRank与TrustRank影响因素分析

PageRank(PR)里的page不是指网页,而是指Google创始人拉里?佩奇(Larry Page),是他在2001年申请的专利中以自己名字命名的,Google的PageRank根据网站的外部链接和内部链接的数量和质量来衡量网站的价值。TrustRank(信任指数)是2006年雅虎申请的一项专利,Trust Rank是用来检测垃圾网站的,但现在的搜索引擎排名算法中,常常影响大部分网站的整体排

Public @ 2015-02-25 15:39:09

李彦宏超链分析专利,超链分析算法的作用

互联网上的信息非常的庞大,要想让用户搜索到精准信息是很难的。搜索引擎技术非常复杂。百度创始人李彦宏在创立百度之前就已经是国际上比较厉害的搜索引擎技术专家了。据说李彦宏在找风险投资时,投资人询问了三个搜索引擎界的技术牛人一个同样的问题:要了解搜索引擎技术应该找谁,其中两个人回答说找李彦宏,由此投资人就断定李彦宏是最了解搜索引擎的人之一。李彦宏超链分析示意图这其实就是现实生活中链接关系的应用:要判断哪

Public @ 2020-01-04 15:39:01

更多您感兴趣的搜索

0.444925s