Categories


Tags


HITS算法

HITS算法是一种采用迭代计算的网络算法,用于计算网络中节点的权重。该算法主要用于网络信息检索等计算技术。HITS算法与传统的关键词检索不同,关键词检索是以词语为基础,以文档为主要检索对象,结果通过匹配检索关键词的文档及其相关性程序来返回结果。而HITS算法则是以链接为基础,以网页为主要检索对象,通过计算每个页面的被链接的频度和链接其它页面的重要程度来决定查询结果的排序。该算法基于“authrity”和“hub” 有权重概念,这两个概念可以描述网页在网络中的影响力,分别表示该网页在某个领域的权威程度和其链接的重要性。简而言之,权威页面是指拥有很多高质量链接的页面,而活跃页面则指拥有很多高质量链接的页面,它们可以在网络吸引到更多浏览者。 HITS算法依基于两个基本元素:基于输入计算出的权重和输出给出的权重,用来计算每一网页的重要性,也可以用来衡量网络上不同页面链接的重要性。HITS算法通过对网络进行逐步迭代,来计算每个页面的权威程度及其Mining后的重要程度。在每一次迭代中,权威页面的权重由其上一轮的权重和指向它的链接的权重共同决定,活跃页面的权重也是由其上一轮的权重和指由它发出的链接的权重共同决定的。采用此算法,可以在网络上寻找拥有最高重要性的节点来代表该网络,这样就可以有效地改善搜索结果的质量。

Public @ 2023-02-25 06:01:28

Google专利:怎样鉴别和处理垃圾链接

在自己网站上使用SEO作弊手法,诸如隐藏文字,隐藏链接,关键词堆积,隐藏页面,JS转向等,是比较传统的作弊方式,也更加危险。因为证据确凿,被抓住没什么好狡辩的,证据全在自己网站上摆着呢。而靠垃圾链接提高排名,就有点说不清道不明的感觉。在博客或论坛群发,就算被检测到,搜索引擎在处理时也会比较谨慎,因为很难断定群发是谁干的。虽然大部分情况下是站长自己干的,但鉴于现在很多人为了排名能变成黑客,也不排除有

Public @ 2015-05-22 15:54:34

李彦宏超链分析专利,超链分析算法的作用

互联网上的信息非常的庞大,要想让用户搜索到精准信息是很难的。搜索引擎技术非常复杂。百度创始人李彦宏在创立百度之前就已经是国际上比较厉害的搜索引擎技术专家了。据说李彦宏在找风险投资时,投资人询问了三个搜索引擎界的技术牛人一个同样的问题:要了解搜索引擎技术应该找谁,其中两个人回答说找李彦宏,由此投资人就断定李彦宏是最了解搜索引擎的人之一。李彦宏超链分析示意图这其实就是现实生活中链接关系的应用:要判断哪

Public @ 2020-01-04 15:39:01

HITS链接分析算法

HITS(Hyperlink - Induced Topic Search)链接分析算法诞生在1997年,该算法是由康奈尔大学中的一位博士提出,并且该算法沿用于全球多个搜索引擎当中。当然,不同的搜索引擎针对于该算法的侧重点和内部公式都有不一的算法结构调整,并且HITS算法也是链接分析中最为重要的基础算法之一。对于目前国内的整体搜索引擎而言,百度作为国内的搜索引擎领头羊,我会带着HITS的公开文档针

Public @ 2009-11-28 15:39:11

更多您感兴趣的搜索

0.451331s