Categories


Tags


网站文章内链的一个思路

内链:顾名思意就是在自己网站的内容中的相关文字加入链接,并且链接到网站内部的相关页面。合理的网站内空链接构造,能提高搜索引擎的收录与网站权重。相对外部链接,内部链接也很重要。

传统方式

以前我们做文章系统或新闻发布系统的时候,做文章内链(标签)的时候,通常是通过以下方式来实现的:

数据库:article(文章表)字段(id, title, body, adddate, userid),keyword(内链表)字段(id, name, link)

在发布文章的时候,循环内链表内的所有,来替换文章的body。

这样确实是实现了想要的功能,但是如果我们的内链表的数据达到很大的数目,比如2W、5W或更多的时候。每发布和修改一片文章的效率是可想而知的。那么网易的新闻、百度的百科等这样打大型网站是如何实现的呢?如果按照以上的做法,那系统在几个月后就直接崩溃了。

分析比较

一篇正常的文章会有多少字(不计HTML代码)?1W?我想1W的文章已经算是很长的了,而且想在如果直接在一个页面显示1W的文章相信没有几个人有耐心能看完的。为了页面美观和用户体验,编辑通常都是将内容过多、篇幅超长内容的文章分段处理(分为几篇文章,或分章节)。如果我们能事先将可能出现内链的字从文章中提取出来,再从数据库里检索,这样效率是不是就可以得到很大的提高?答案是肯定的。我们就拿1W字的文章来说,假设文章的所有文字都需要内链,循环的次数是1W次。比上面的例子假设要强得多吧?

在传统方式中,不管你要不要,把内链表的东西全查一边。而下面这种思路是事先将有可能出现内链的字词全部整理出来,再用这些词分别去检索内链表。这样一比较问题就出来了。

新思路就是:从文章中取出需要内链的字词,然后去查询内链表。

可行操作

我们暂且把传统方式称为被动方式,把新思路的方法称为主动方式。

主动方式的实现方法如下。

利用中文分词技术,我们可以对一篇文章进行分词。然后根据分词后的词表,过滤掉常用的物主代词、副词、感叹词等。把名词、品牌、地名、商标等留下,或者根据自己的词库表来分词。然后把剩余的字词去检索内链表,如果有存在,我们就坐上链接,不存在就PASS。

以上只是思路的一个初步构思,在实际实现过程中需要考虑的因素很多。我觉得重点就在分词这个环节。

来源:读者沈力投稿

来源:月光博客


Public @ 2012-09-14 16:11:25

搜索引擎收录机制是什么?

百度更喜欢独特的原创内容,如果你的站点内容只是从各处采集复制而成,很可能不会被百度收录。关于Google的各种SEO方法在网上随处可见,其中当然有真有假。比如早在4月份,我们从Matt Cutts那里已经知道一个流传得很广的SEO方法--在网站上投放AdSense广告有利于网站内容被Google收录--已经被证实,尽管这并不能提高网站排名。除了投放广告外,另外一个传闻就是只要你给你的浏览器安装了G

Public @ 2021-10-21 15:55:41

网站URL优化怎么做,对于网站SEO的意义有哪些?

网站url设计在每一个网站建设过程中,都是需要考虑的问题,网站链接在设计的时候,需要对网站的目录和文件这些做好命名系统,还需要提前规划好一些事情。对于网站域名链接来说。我们必须站在用户的角度上出发的,url要清晰友好、便于记忆,然后再考虑对搜索引擎排名的影响!那我们在对链接进行优化的时候有哪些需要注意的原则呢?一、网站的URL类型(1)动态URL路径网站动态的URL路径,指的就是动态的页面,那么,

Public @ 2021-02-25 16:12:02

网站文章内链的一个思路

1. 内链到相关主题:在文章中添加内链时,应该考虑到与文章主题相关的其他文章或网页。这样做可以为读者提供更深入的知识和信息,同时也可以提高网站的整体质量和权重。 2. 内链到旧文章:经常更新并维护网站是提高SEO的有效方法之一。因此,内链到旧文章可以帮助它们重新获得流量,并在SEO方面增加Maximize。 3. 内链到高质量内容:内链应该指向高质量、受欢迎的内容和网站,这样可以为您的网站带来

Public @ 2023-06-14 06:00:37

网站内链优化策略

一个网站要想快速的提高栏目和文章的排名,其合理布局网站的内链结构是必不可少的。相当外部链接而言,内部链接就比较容易控制,成本低。你直接就可以在自己的站上进行部署,不像外部链接的不可控性比较大,需要大量的购买或长期的积累才有办法实现稳定的SEO效果。内链,顾名思义就是在同一网站域名下的内容页面之间的互相链接(自己网站的内容链接到自己网站的内部页面,也称之为站内链接)。合理的网站内链接构造,能提高搜索

Public @ 2009-03-05 16:11:26

更多您感兴趣的搜索

0.446452s