Categories


Tags


搜索引擎面临哪些问题

网页时效性:互联网上的用户众多,数据信息来源极广,互联网上的网页是呈实时动态变化的,网页的更新、删除等变动极为频繁,有时候会出现新更新的网页在爬虫程序还来不及抓取的时候却已经被删除的情况,这将大大影响搜索结果的准确性。  

大数据存储问题:爬虫抓取的数据在经过预处理后数据量依然相当庞大,这给大数据存储技术带来相当大的挑战。当前大部分搜索引擎都是利用结构化的数据库来存储数据,结构化的数据库存储的数据具有高共享、低冗余等特点,然而由于结构化的数据库难以并发查询所以存在查询效率受限的问题。  

检索结果可靠性:目前由于数据挖掘技术以及计算机硬件的限制使得数据处理准确度未能达到理想程度,而且由于一些个人或公司利用搜索引擎现有的漏洞通过作弊手段来干扰检索结果导致检索结果的可靠性可能会有损失。


Public @ 2013-08-22 16:22:54

搜索引擎有多聪明?

使用黑帽SEO的人,心里或多或少都存在一个假设,那就是搜索引擎没自己聪明。在前几天的搜索引擎怎样判断垃圾留言这个帖子里,就有读者认为我把搜索引擎快说成神了。我想很多人都会抱有这种想法,理由也很简单,搜索结果中含有大把大把的作弊网站,垃圾网站。如果搜索引擎真的那么聪明的话,这些网站怎么还会排名不错呢?对搜索引擎到底有多聪明,今天谈谈自己的想法。首先从常理上来说,主要搜索引擎内部的工程师,大多都是博士

Public @ 2009-07-02 16:22:40

搜索引擎蜘蛛抓取份额是什么?

一月份时,Google新的SEO代言人Gary Illyes在Google官方博客上发了一篇帖子:What Crawl Budget Means for Googlebot,讨论了搜索引擎蜘蛛抓取份额相关问题。对大中型网站来说,这是个颇为重要的SEO问题,有时候会成为网站自然流量的瓶颈。今天的帖子总结一下Gary Illyes帖子里的以及后续跟进的很多博客、论坛帖子的主要内容,以及我自己的一些案例

Public @ 2011-06-02 16:21:52

更多您感兴趣的搜索

0.402182s