Categories


Tags


搜索引擎面临哪些问题

网页时效性:互联网上的用户众多,数据信息来源极广,互联网上的网页是呈实时动态变化的,网页的更新、删除等变动极为频繁,有时候会出现新更新的网页在爬虫程序还来不及抓取的时候却已经被删除的情况,这将大大影响搜索结果的准确性。  

大数据存储问题:爬虫抓取的数据在经过预处理后数据量依然相当庞大,这给大数据存储技术带来相当大的挑战。当前大部分搜索引擎都是利用结构化的数据库来存储数据,结构化的数据库存储的数据具有高共享、低冗余等特点,然而由于结构化的数据库难以并发查询所以存在查询效率受限的问题。  

检索结果可靠性:目前由于数据挖掘技术以及计算机硬件的限制使得数据处理准确度未能达到理想程度,而且由于一些个人或公司利用搜索引擎现有的漏洞通过作弊手段来干扰检索结果导致检索结果的可靠性可能会有损失。


Public @ 2013-08-22 16:22:54

如何知道我的网站是否已被360搜索收录?

360搜索支持“site”语法,您可在搜索框内输入“site:”+“您的网站域名”,如果搜索结果中出现了您的网站内容,那就说明该网站已经被我们收录了。例如,您的网站域名为www.abc.com,您只需在搜索框中输入“site:www.abc.com”便可。如果您通过我们的收录页面进行了申请,当您的网站被收录后,我们会将收录结果反馈至您的联系邮箱。您可以在您的联系邮箱中看到收录结果。

Public @ 2015-10-10 15:55:48

为什么同样类型或相近的网站,有的可以被收录,有的则不被收录?

360搜索是以用户体验和用户安全为原则进行网站收录的,我们会对高质量原创且符合用户需求的站点进行收录,一些资源可替代并且质量较差的内容,甚至非原创采集的内容,我们将酌情收录或不收录。建议您根据我们发布的《360搜索网页质量白皮书》,进行排查,并调整与优化。

Public @ 2015-09-03 15:55:46

搜索引擎面临哪些问题

网页时效性:互联网上的用户众多,数据信息来源极广,互联网上的网页是呈实时动态变化的,网页的更新、删除等变动极为频繁,有时候会出现新更新的网页在爬虫程序还来不及抓取的时候却已经被删除的情况,这将大大影响搜索结果的准确性。  大数据存储问题:爬虫抓取的数据在经过预处理后数据量依然相当庞大,这给大数据存储技术带来相当大的挑战。当前大部分搜索引擎都是利用结构化的数据库来存储数据,结构化的数据库存

Public @ 2013-08-22 16:22:54

搜索引擎蜘蛛抓取份额是什么?

一月份时,Google新的SEO代言人Gary Illyes在Google官方博客上发了一篇帖子:What Crawl Budget Means for Googlebot,讨论了搜索引擎蜘蛛抓取份额相关问题。对大中型网站来说,这是个颇为重要的SEO问题,有时候会成为网站自然流量的瓶颈。今天的帖子总结一下Gary Illyes帖子里的以及后续跟进的很多博客、论坛帖子的主要内容,以及我自己的一些案例

Public @ 2011-06-02 16:21:52

更多您感兴趣的搜索

0.510360s