Categories


Tags


网站文章内链的一个思路

内链:顾名思意就是在自己网站的内容中的相关文字加入链接,并且链接到网站内部的相关页面。合理的网站内空链接构造,能提高搜索引擎的收录与网站权重。相对外部链接,内部链接也很重要。

传统方式

以前我们做文章系统或新闻发布系统的时候,做文章内链(标签)的时候,通常是通过以下方式来实现的:

数据库:article(文章表)字段(id, title, body, adddate, userid),keyword(内链表)字段(id, name, link)

在发布文章的时候,循环内链表内的所有,来替换文章的body。

这样确实是实现了想要的功能,但是如果我们的内链表的数据达到很大的数目,比如2W、5W或更多的时候。每发布和修改一片文章的效率是可想而知的。那么网易的新闻、百度的百科等这样打大型网站是如何实现的呢?如果按照以上的做法,那系统在几个月后就直接崩溃了。

分析比较

一篇正常的文章会有多少字(不计HTML代码)?1W?我想1W的文章已经算是很长的了,而且想在如果直接在一个页面显示1W的文章相信没有几个人有耐心能看完的。为了页面美观和用户体验,编辑通常都是将内容过多、篇幅超长内容的文章分段处理(分为几篇文章,或分章节)。如果我们能事先将可能出现内链的字从文章中提取出来,再从数据库里检索,这样效率是不是就可以得到很大的提高?答案是肯定的。我们就拿1W字的文章来说,假设文章的所有文字都需要内链,循环的次数是1W次。比上面的例子假设要强得多吧?

在传统方式中,不管你要不要,把内链表的东西全查一边。而下面这种思路是事先将有可能出现内链的字词全部整理出来,再用这些词分别去检索内链表。这样一比较问题就出来了。

新思路就是:从文章中取出需要内链的字词,然后去查询内链表。

可行操作

我们暂且把传统方式称为被动方式,把新思路的方法称为主动方式。

主动方式的实现方法如下。

利用中文分词技术,我们可以对一篇文章进行分词。然后根据分词后的词表,过滤掉常用的物主代词、副词、感叹词等。把名词、品牌、地名、商标等留下,或者根据自己的词库表来分词。然后把剩余的字词去检索内链表,如果有存在,我们就坐上链接,不存在就PASS。

以上只是思路的一个初步构思,在实际实现过程中需要考虑的因素很多。我觉得重点就在分词这个环节。

来源:读者沈力投稿

来源:月光博客


Public @ 2012-09-14 16:11:25

原来404页面可以这样做

404页面是网站必备的一个页面,它承载着用户体验与SEO优化的重任。404页面通常为用户访问了网站上不存在或已删除的页面,服务器返回的404错误。如果站长没有设置404页面,会出现死链接,蜘蛛爬行这类网址时,不利于搜索引擎收录。原来404页面可以这样做 网站设计 用户体验 建站教程 第1张设置404页面的两大好处1:引导用户不要关闭网站,增强用户体验。2:防止网站出现死链接。设计404页面的你可以

Public @ 2015-09-19 16:09:56

什么是死链接?

简单地讲,死链接指原来正常,后来失效的链接。死链接发送请求时,服务器返回404错误页面。在这些情况下出现死链接:动态链接在数据库不再支持的条件下,变成死链接。某个文件或网页移动了位置,导致指向它的链接变成死链接。网页内容更新并换成其他的链接,原来的链接变成死链接。网站服务器设置错误。从用户的角度来看,死链接和错误链接的表现是一样的,所以一般我们并不需要区别死链接和错误链接。作为SEO人员或网站管理

Public @ 2021-12-09 15:56:17

网站内部链接策略

当站长们都在讨论外链的时候,很少有人注意到内链的作用,内链就是网站的内部的相互链接,我认为内链的最主要的作用在于提高搜索引擎索引效率和用户体验,增加PV,除此之外,由于是自己的网站,内链容易控制,有助于PR的传递推动网站排名。博友Fgyb_网民聚焦:对于知名站点的seo而言主要精力应该放在内链的合理布局上,改善搜索引擎的抓取效率,让搜索引擎明白什么内容才是网站的重要的内容。既然内链与外链有着同样重

Public @ 2018-10-24 16:11:27

网站内链是什么?

网站内链,指网站的各级导航、锚文本和由图片、图标、视频等媒体附带的站内链接,狭义上仅指在网站内部指向其它内部页面的锚文本。网站内链可以使用户轻松实现站内的页面跳转。一个结构清晰的网站和金字塔类似,即从首页沿一级和二级导航跳转向各个分页面,各个分页面之间以关键词锚文本或页面切换的方式互相跳转,实现了站内页面的连贯性和相关性。好的网站内链不仅能加快用户提取页面内关键信息的速度,而且能使各大搜索引擎的蜘

Public @ 2010-02-12 16:11:29

更多您感兴趣的搜索

0.457054s