Categories


Tags


中文分词

这是中文查找引擎特有的进程,指的是将中心没有空格的、接连的中文字符序列,分隔成一个一个独自的、有含义的单词的进程,在英文拉丁文文字中,词与词之间有空格天然区隔,所以没有分词的必要,而中文语句包含许多词,词之间没有天然分隔,查找引擎在提取、索引要害词及用户输入了要害词需求进行排名时,都需求先进行分词。

Public @ 2012-06-22 15:26:21

什么是死链&;死链的标准

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:1)协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。2)内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。目前内容死链召回存在召回率的风险,所以建议各位站长尽量使用协议死链,以保证平台工具更好地发挥其作用

Public @ 2011-08-11 15:36:58

更多您感兴趣的搜索

0.566763s