Categories


Tags


网站日志在哪里?如何下载日志?

网站日志是做SEO时网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。在很多时间,我们需要查看网站日志。以获得了解搜索引擎如何爬取咱们的网站。

如何下载日志

通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。

微信图片_20181108173907.

如何查看日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度,这部分为本文添加)

203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)

202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)

65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)

日志文件样板全文下载:

http://edu.seowhy.com/ziliao/wwwlog20090112.log

如何分析日志

蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider。在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。

我们分析的主要点是,HTTP状态码,如以上的200和301。

" 200 5162 " 代表正常抓取,这次抓取了5162个字节。

不同的服务器或虚拟主机设置的日志记录内容不同。

有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。

有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。

304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。

来源:搜外网


Public @ 2012-04-17 15:32:53

人工智能将彻底改变SEO

作为一个AI语言模型,我可以告诉你:人工智能已经开始改变了SEO,而且这个趋势在未来将会愈发明显。 人工智能被应用在搜索引擎算法中,使得搜索结果更精准、更符合用户意图。例如,搜索引擎会根据用户历史搜索记录和浏览行为,为用户提供更加个性化的搜索结果,这就是基于AI的推荐算法。 此外,人工智能还在图像搜索、语音搜索、自然语言处理等领域得到广泛应用。这些技术的普及,也进一步改变了SEO的规则。 S

Public @ 2023-04-03 04:00:14

网站域名的详解,域名和网站名的联系

网站域名是指网站在互联网上的唯一标识,由一串字符组成,用于用户访问和识别特定的网站。域名由多个部分组成,包括顶级域名(TLD)、二级域名、子域名等。 域名的详解如下: 1. 顶级域名(TLD):是域名中的最高级别部分,如.com、.cn、.org等。顶级域名通常表示域名所属的国家、地区或组织。 2. 二级域名:是紧接在顶级域名后面的部分,通常表示具体的网站名称,如baidu.com中的"baid

Public @ 2023-07-30 06:00:39

做网站SEO优化,网站日志分析是必备的技能

网站的SEO优化过程中不免会分析网站日志,网站日志的分析和诊断就像给网站看病一样,我们通过网站日志的分析,可以更加清楚的知道网站的健康状况,使用这些数据更有利于开展网站SEO优化。通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。对于专业从事搜索引擎优化工作者而言,网站日志可以记录各搜索引擎蜘蛛机器人爬行网

Public @ 2012-07-16 15:32:52

服务器日志在SEO里的常见用途

服务器日志在SEO里的常见用途有哪些呢?服务器日志用来记录网站被访问的全过程,我们可以从中看到,什么时间有哪些用户(搜索引擎)来过?都访问过哪些内容?访问时是否出错?等一些基础的访问行为。1、修正抓取分布对于大型站点,尤其是海量数据的网站,相对每个页面资源来说,其获取到的抓取资源也是非常有限的。这很有可能就会导致些版块SEO产生问题。比如网站有10个核心的栏目内容,但是其中有5个是被爬虫顿繁抓取的

Public @ 2013-06-18 15:32:50

更多您感兴趣的搜索

0.440025s