Categories


Tags


中文分词

这是中文查找引擎特有的进程,指的是将中心没有空格的、接连的中文字符序列,分隔成一个一个独自的、有含义的单词的进程,在英文拉丁文文字中,词与词之间有空格天然区隔,所以没有分词的必要,而中文语句包含许多词,词之间没有天然分隔,查找引擎在提取、索引要害词及用户输入了要害词需求进行排名时,都需求先进行分词。

Public @ 2012-06-22 15:26:21

相关性(relevance)

相关性指的是事物之间的关联程度或相似程度。在信息检索中,相关性通常描述了查询与搜索结果之间的匹配程度或相关性程度。一般来说,相关性越高,搜索结果越符合查询的意图,而反之则越不相关。相关性的评估通常由算法和模型来实现,例如TF-IDF、BM25等算法。

Public @ 2023-06-15 15:00:08
0.522287s