Categories


Tags


网站日志在哪里?如何下载日志?

网站日志是做SEO时网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。在很多时间,我们需要查看网站日志。以获得了解搜索引擎如何爬取咱们的网站。

如何下载日志

通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。

微信图片_20181108173907.

如何查看日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度,这部分为本文添加)

203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)

202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)

65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)

日志文件样板全文下载:

http://edu.seowhy.com/ziliao/wwwlog20090112.log

如何分析日志

蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider。在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。

我们分析的主要点是,HTTP状态码,如以上的200和301。

" 200 5162 " 代表正常抓取,这次抓取了5162个字节。

不同的服务器或虚拟主机设置的日志记录内容不同。

有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。

有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。

304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。

来源:搜外网


Public @ 2012-04-17 15:32:53

Google Adsense蜘蛛抓取的网页在搜索中出现

前两天Matt Cutts刚刚证实,Google Adsense蜘蛛(Mediapartner bot)所抓取的网页会在Google搜索中出现。Matt Cutts说这只是一个节省带宽开支的手段而已。由于Google蜘蛛(Googlebot/2.1)所抓取的网站之多和频率之紧密,他们每天需要使用的带宽是巨量的。把Adsense蜘蛛所抓取的网站内容考虑进主搜索引擎中,一定会节省大量的带宽开支。实际上

Public @ 2016-03-05 15:30:09

如何去大公司上班?

有过不少文章讨论的是去大公司还是小公司,虽然很多人认为这问题不重要,重要的是自己的规划和选择,但今天我在这里给出的答复是:去大公司好。如何去大公司上班? 工作 经验心得 第1张(配图:大学生宿舍)罗永浩,如果不是当年有新东方这个大牌给他光环,今天哪来的风投做锤子?张小龙,如果没有腾讯这个大平台,自己能做出这样的成就吗?据我所知,假如你在百度,要换工作了,只要说句话,腾讯、阿里首先就会抛出橄榄枝,在

Public @ 2019-10-07 15:27:47

怎样看原始日志文件

原始日志文件通常以文本文件的形式存在。以下是一些底层操作系统上打开和查看日志文件的常见方法: 在Windows系统上: 1. 打开“开始”菜单,找到“运行”选项,并在其中输入“notepad.exe”命令。 2. 在记事本中,选择“文件”菜单,并选择“打开”选项。 3. 导航到原始日志文件所在的路径,用鼠标单击选中该文件,并单击“打开”按钮。 4. 使用记事本查看原始日志文件的内容。 在Un

Public @ 2023-05-26 23:50:18

做网站SEO优化,网站日志分析是必备的技能

1. 编写有吸引力的标题和元标签:让你的网站在搜索引擎的搜索结果中脱颖而出。 2. 使用关键词:添加关键词来调整网站内容,更好地搜索到消费者想看到的东西。 3. 优化内部链接:通过优化内部链接,使搜索引擎非常容易发现你的网站。 4. 发布有质量的内容:优质的内容可以吸引到目标客户,并且可以长期增加搜索排名。 5. 增加外部链接:通过向其他网站添加链接,可以为你的网站提供权威性和可信度,

Public @ 2023-02-26 03:27:24

更多您感兴趣的搜索

0.545150s