Categories


Tags


搜索引擎怎样抓到你?

用户行为方式怎样影响搜索引擎排名结果,是很多SEO一直关心探讨的问题。

前一阵在点石论坛上就看到关于在百度大量点击搜索结果中自己的网站,从而进一步提高排名的讨论。其逻辑是,搜索结果中的某个网站被点击次数越多,说明越有用,用户越喜欢,搜索引擎会更进一步提高这个网站的排名。

不过这种用户行为方式是噪声很大的数据,极容易作弊。搜索引擎要在这些数据中提炼出精华非常困难。

前几天Google员工JohnMu就在Google帮助论坛里明确说,诸如点击某个网站,然后立即点返回按钮,这种操作并不会影响你网站的抓取、索引和排名。这太容易作弊,太容易被竞争对手利用了。

类似这种看似很有价值,却又很难提炼有用信息的数据还很多。比如给竞争对手网站群发垃圾链接。

说到底,要有效利用用户行为数据,关键在于搜索引擎怎样确认用户身份,也就是说准确辨别特定行为到底是谁干的。如果是大量真实的用户点击你的网站,停留的时间很长,那么对排名一定有益。如果搜索引擎能判断出这大量点击就是你一个人,或者是与你有关的一群人干的,可能效果正相反。

给对手群发也是如此,关键在于判别是谁群发。

我以前写过一篇无所遁形,更多属于科幻和瞎想。但谁敢肯定有朝一日,在网上通过基因来判断身份不会实现呢?20年前,如果谁跟我讲会有互联网,会有网站,会有SEO,那时候我也会觉得是科幻。

现在搜索引擎其实已经掌握了大量的数据,能帮助鉴别用户身份。比如Google就可以通过cookies,JS脚本,工具条,gmail帐号,Adsense帐号,Google Analytics帐号,IP地址,用户搜索数据等判定和鉴别用户身份。

一个用户如果登录过gmail帐号,再访问任何带有Adsense,Google Analytics,以及Google所能控制的任何JS脚本的网页,这些访问数据都将被记录在案。而带有Google JS脚本的网站现在多如牛毛,除了明显的Adsense,Google Analytics等,现在Google还收购了最大的网络广告公司DoubleClick,无数有广告的网站都在使用Google的代码。所以你在网上的一举一动,很难逃过Google的眼睛。

如果安装了Google的工具条,那你访问网站的情况就更一目了然了。

就算你能极端洁身自好,不露痕迹,既不登录任何Google帐号,浏览器关掉JS脚本功能,也不用工具条。总之你就是个隐身人,也还是不能保证搜索引擎就抓不到你。

比如说,如果你通过一个联盟买卖链接,这是Google很痛恨的事情。就算你能做到隐身,但你无法保证这个联盟里的其他人都能不露痕迹。如果这个链接买卖联盟里面的一些人暴露了身份,而这些人时不时访问一下你的网站,检查他们所买的链接,你的网站和你自己也就露馅了。

觉得搜索引擎没有这么聪明吗?谁知道呢?小心为妙。

来源:SEO每天一贴 Zac 昝辉


Public @ 2015-05-11 16:21:51

搜索引擎工作原理

基本流程抓取网页。每个独立的搜索引擎都有自己的网页抓取程序爬虫(Spider)。爬虫顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索

Public @ 2015-11-08 16:21:49

爬行和抓取

爬行和抓取在计算机领域中都指数据采集的过程。 爬行是指使用网络爬虫程序,通过抓取网页上的数据来建立一个数据集。例如,搜索引擎就使用网络爬虫程序来收集网页上的内容,以便用户进行搜索。 抓取则是指通过编写程序从特定的网站或数据源上抓取数据,以便进行分析或者处理。例如,电商平台可以使用抓取程序从竞争对手的网站上抓取商品价格信息,以便制定自己的价格策略。 总的来说,爬行和抓取都是数据采集的方式,只是

Public @ 2023-04-07 23:50:49

搜索引擎工作原理

搜索引擎的工作原理大致如下: 1. 网络爬虫(Spider):搜索引擎会派遣网络爬虫,搜索引擎爬虫通过扫描互联网上的网页,并收集这些网页的信息,包括标题、关键词、描述、网址、内容、超链接等。 2. 索引(Index):搜索引擎将收集到的网页内容进行分析,提取出其中的关键词,并将这些关键词存入一个大型的索引库中,以便后续快速查询。 3. 检索(Retrieval):当用户输入查询词时,搜索引擎

Public @ 2023-04-14 20:00:35

搜索引擎工作的基础流程与原理

感谢Mr.Zhao的投稿:搜索引擎最重要的是什么?有人会说是查询结果的准确性,有人会说是查询结果的丰富性,但其实这些都不是搜索引擎最最致命的地方。对于搜索引擎来说,最最致命的是查询时间。试想一下,如果你在百度界面上查询一个关键词,结果需要5分钟才能将你的查询结果反馈给你,那结果必然是你很快的舍弃掉百度。搜索引擎为了满足对速度苛刻的要求(现在商业的搜索引擎的查询时间单位都是微秒数量级的),所以采用缓

Public @ 2018-10-26 16:22:22

更多您感兴趣的搜索

0.504718s