Categories


Tags


搜索引擎怎样判断文章或网页的原始出处?

复制内容网页有的时候会影响网页排名。

比如说原本是你写的文章,本来应该排名很好,但是其他人抄袭或转载你的文章,而且搜索引擎不幸的判断那篇被抄袭或转载的网页是原始出处的话,你应有的排名就会被那个网页夺走。

那么搜索引擎怎样才能从多个网页中挑出哪一个是原始出处呢?可能有以下几个考虑:

1)网页PR值。网页PR值越高,被认为是原始版本的可能性就越大。

2)网页第一次被收录的时间。网页被搜索引擎收录的时候越早,相比后发现的相同内容的网页来说,被当作原始出处的可能性就越大。

3)域名注册时间。越老的域名上面的网页被当成原始出处的可能性也越大。

4)网站的权威度。这就有点说不清了,可能包含前面3个因素,还有很多其他因素。

但到目前为止,无论以哪一个因素为主,或怎样组合这些因素,都不可能完全正确从多个网页中挑出原始出处。

比如说我这个博客就很新,域名也很新,文章被收录的时间有的时候也不一定是最早的,就权威地位和被信任度来说,也肯定比不上很多中文网站。但我的博客新,我的域名新,并不意味着我的内容就不是原始出处,实际上我的所有博客都是原创。

我最近也发现了很多网站都转载,有的时候是抄袭我的博客内容,很多网站的规模,历史,PR值都比我的网站要高的多。

在检测文章原始出处方面,Google做的比较好,基本上能够正确判断,百度做的就比较差。从我的文章在不同的地方出现的情况看,百度似乎认为域名比较老的就是原创。

这个问题不是网站管理员自己可以解决的,只有依靠搜索引擎算法的改进。

来源:SEO每天一贴 Zac 昝辉


Public @ 2017-04-29 16:21:50

头条搜索Bytespider基本流程

1. 确定搜索对象:首先需要确定搜索的关键词或者主题,同时要考虑搜索的范围和时间范围。 2. 制定搜索策略:基于搜索对象和搜索范围,制定针对性的搜索策略,选择合适的搜索引擎,在搜索过程中要注意细节,如设置搜索选项等。 3. 搜集信息:第三步就是进行搜索,搜集相关信息,可以应用各种搜索工具,如搜索引擎、专业数据库、社交媒体等,搜集到的信息需要进行分类整理,提取有用的信息,剔除无效信息。 4.

Public @ 2023-06-11 13:50:15

百度搜索引擎工作原理-3-检索排序

检索排序是指根据用户查询的关键词和相关度分数对文档进行排序,以便在搜索结果页面中将最相关和最相关的文档排在前面。百度搜索引擎使用了一种称为PBM(Probabilistic Boolean Model)的检索算法来衡量文档的相关性,以及PageRank算法来确定文档的权重和排名。 PBM算法将计算文档中包含用户搜索查询词的概率,并以此计算文档的相关度得分。这个概率是通过使用贝叶斯公式结合词频率、

Public @ 2023-06-16 04:00:39

搜索引擎的用户是什么?

搜索引擎的用户是网上搜索信息的人,客户是广告商。目前所有的搜索引擎都是通过搜索竞价广告赢利的,不同搜索引擎的区别只在于竞价广告出现的位置、数目及是否比较清晰地标明是广告,其PPC本质是一样的。要想通过搜索广告赢利,就必须有搜索用户使用搜索引擎。那站长们(以站长身份出现时而不是搜索用户)说到底不是搜索引擎的用户,更不是他们的客户。搜索引擎并不欠站长或SEO人员什么东西,网站收录不收录,排名怎么样,都

Public @ 2015-07-06 16:04:53

搜索引擎对frame和iframe框架是否友好?

首先,Frame和iframe代码框架的意思是在当前页面中插入另一个页面,可以说是调用也可以说是使用代码插入。比方我们在的页面为a.html 对于a.html的页面我们存在不满意,但是为了达到某种目的。而再创建以个页面b.html 然后把b.html用js调用的方式或是其他div以及代码方式插入到a.html 。可以理解为b.html是当前页面中(a.html)的独立子页面,与父页面同时展示。需要

Public @ 2010-11-09 16:22:40

更多您感兴趣的搜索

0.481044s