Categories


Tags


搜索引擎对用户搜索词如何处理,怎么判断用户搜索词的结果?

搜索引擎接收到用户输入的搜索词后,需要对搜索词做一些处理,才能进入排名过程。

搜索词处理包括以下几方面:

(1)中文分词。与页面索引时一样,搜索词也必须进行中文分词,将查询字符串转换为以词为基础的关键词组合。分词原理与页面分词相同。

(2)指令的处置。平时咱们在搜索时会输入多个词语,实在默认的情况下,搜索引擎把多个默认的词语都依照“与”来进行词语。比方你搜索“seo”“培训”时,搜索引擎会默认咱们输入的“seo培训”来进行处置,独自包括“seo”或者“培训”的网站内容实践上将不会返回,但实际情况往往也会呈现独自包括一个词语的网站。另外,还要处置各种高等搜索指令的词语,比方加号减号等。

(3)停止词。和索引时一样,搜索引擎也需要把搜索词中的停止词去掉,最大限度地提高排名相关性及效率。

(4)过错纠正。用户如果输入了明显错误的字或英文单词拼错,搜索引擎会提示用户正确的用字或拼法。

(5)整合搜索触发。某些搜索词会触发整合搜索,比如明星姓名就经常触发图片和视频内容,当前的热门话题又容易触发资讯内容。(搜外网)


Public @ 2019-02-03 16:22:41

搜索引擎行业大混战

最近搜索引擎领域事情比较多。前两天Google和戴尔Dell正式宣布合作,所有戴尔生产的电脑都将预装Google工具条和桌面搜索等工具,Google为此要向戴尔支付的价钱不祥。实际上这只是一个正式声明,有关消息我以前就已经提到过了。另一个重大新闻是,雅虎和eBay结成联盟。eBay将显示雅虎所提供的所有图片广告和部分文字竞价广告,而雅虎将把PayPal作为正式线上付款工具纳入自己的电子商务体系。再

Public @ 2023-01-29 15:27:37

如果您网站在搜索结果中的排名与之前相比落差很大,请参考以下指南以确定问题

A.查看您的robots.txt文件,检查您有没有拦截sogou spider访问自己网站上的任何网址或目录。B.查看您的网站结构并确保其易于访问,大多数搜索引擎是基于文本的。如果您使用 JavaScript、DHTML、图片或富媒体(例如 Silver light)来创建导航和链接,那么,sogou spider在抓取您的网站时可能会遇到问题。请确保您的内容是可以读取的文本内容,以便用户和sog

Public @ 2013-07-22 16:22:45

搜索引擎工作的基础流程与原理

搜索引擎工作的基本流程如下: 1. 网络爬虫:首先搜索引擎需要通过网络爬虫抓取网页,并对网页进行解析,将其中的文本、图片、链接等信息提取出来。 2. 存储索引:接着搜索引擎需要将这些信息存储在索引库中,为后续搜索做准备。 3. 搜索关键词:当用户输入关键词进行搜索时,搜索引擎需要对这些关键词进行分词,并对分词结果进行查询,找到相关的网页并按照相关度排序。 4. 显示结果:最后,搜索引擎会按

Public @ 2023-04-02 03:00:29

搜索引擎中各关键功能模块功能简介

(1)爬虫:从互联网爬取原始网页数据,存储于文档知识库服务器。(2)文档知识库服务器:存储原始网页数据,通常是分布式Key-Value数据库,能根据URL/UID快速获取网页内容。(3)索引:读取原始网页数据,解析网页,抽取有效字段,生成索引数据。索引数据的生成方式通常是增量的,分块/分片的,并会进行索引合并、优化和删除。生成的索引数据通常包括:字典数据、倒排表、正排表、文档属性等。生成的索引存储

Public @ 2017-08-24 16:22:25

更多您感兴趣的搜索

0.612548s