Categories


Tags


网站日志在哪里?如何下载日志?

网站日志是做SEO时网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。在很多时间,我们需要查看网站日志。以获得了解搜索引擎如何爬取咱们的网站。

如何下载日志

通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。

微信图片_20181108173907.

如何查看日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度,这部分为本文添加)

203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)

202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)

65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)

日志文件样板全文下载:

http://edu.seowhy.com/ziliao/wwwlog20090112.log

如何分析日志

蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider。在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。

我们分析的主要点是,HTTP状态码,如以上的200和301。

" 200 5162 " 代表正常抓取,这次抓取了5162个字节。

不同的服务器或虚拟主机设置的日志记录内容不同。

有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。

有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。

304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。

来源:搜外网


Public @ 2012-04-17 15:32:53

网站开启CDN能给网站带来哪些好处

CDN专业术语指的是内容分发网络。简单的说是,把网站部署到全国各地的服务器上,吸引就近用户访问,形成这种网络构建是CDN。CDN网络解决 Internet网络拥挤的状况,提高用户访问网站的响应速度。网站开启CDN的好处有哪些?1、降低带宽成本使用CDN能实现网站的全国铺设,不用投入新增宽带成本以及多台服务器的镜像同步,最大程度的降低带宽成本和人力维护成本。2、提升用户访问速度如果含有大量图片和静态

Public @ 2018-01-27 15:26:15

企业网站十大搜索引擎优化通病

虽然现在的一些中小企业也越来越重视网络推广了,很多公司都会在百度、Google上面开始竞价了,但真正网站本身结构做的好的真是凤毛麟角了。这样就直接导致了就算用户从你广告那里点进你的网站,但是因为打开速度太慢或者不容易找到客户想要的产品,直接导致客户关闭你的网站,从而大大降低你的投资回报率。笔者分析了几十个竞争对手网站后,总结了以下10点说明企业网站结构的通病。一. 所有页面的头部和尾部都是一样的(

Public @ 2014-10-01 15:30:25

网站日志(weblog)

网站日志是记载web效劳器接收处理恳求以及运行时过错等各种原始信息的以log结束的文件,切当的讲,应该是效劳器日志,网站日志最大的含义是记载网站运营中比方空间的运营状况,被拜访恳求的记载,经过网站日志可以清楚的得知用户在什么IP、什么时刻、用什么操作系统、什么阅览器、什么分辨率显现器的状况下拜访了你网站的哪个页面,是否拜访成功。  在网站效劳器上的一个文件,作为效劳器所履行的每个操作的记载,日志文

Public @ 2023-01-29 15:32:56

日志中显示页面被抓取了,会收录吗?

日志记录并不是搜索引擎收录的直接因素,因此页面被抓取并不代表会被收录。收录与抓取相关,但并不完全取决于抓取。搜索引擎根据页面内容的质量、权威度、更新频率等多方面因素进行评估,如果页面符合搜索引擎的收录标准,才有可能被收录。

Public @ 2023-04-18 06:50:05

更多您感兴趣的搜索

0.546534s