Categories


Tags


网站日志在哪里?如何下载日志?

网站日志是做SEO时网站管理员和搜索引擎对话沟通的途径。通过日志,了解搜索引擎蜘蛛的访问情况。在很多时间,我们需要查看网站日志。以获得了解搜索引擎如何爬取咱们的网站。

如何下载日志

通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。

微信图片_20181108173907.

如何查看日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)" (注:百度,这部分为本文添加)

203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do-friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" (注:Google)

202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid=323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)" (注:雅虎)

65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)" (注:MSN)

日志文件样板全文下载:

http://edu.seowhy.com/ziliao/wwwlog20090112.log

如何分析日志

蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider。在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。

我们分析的主要点是,HTTP状态码,如以上的200和301。

" 200 5162 " 代表正常抓取,这次抓取了5162个字节。

不同的服务器或虚拟主机设置的日志记录内容不同。

有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。

有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。

304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。

404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。

来源:搜外网


Public @ 2012-04-17 15:32:53

人工智能在搜索算法中的应用

人工智能在搜索算法中应用广泛。以下是几种常见的应用: 1. 排序算法:使用人工智能技术,例如神经网络,可以对搜索结果进行排序,以提高搜索引擎的精度和速度。 2. 路径规划算法:人工智能算法可以帮助计算最短路径、最优路径等,以实现电子地图等应用。 3. 图像搜索算法:使用计算机视觉技术,搜索引擎可以通过图像中的特征识别进行图像搜索。 4. 自然语言处理算法:搜索引擎可以使用自然语言处理技术,

Public @ 2023-04-12 15:01:10

如何保证网站长期的SEO健康度

? 一、提升网站的可用性和可爬性: 1、利用搜索引擎的规则进行页面的多元布局; 2、构建完善的网站导航; 3、使用Robots.txt 增强网站的可爬性; 4、通过链接系统营造紧密交互的空间; 5、为网站页面添加Meta标签,以提升网站在搜索引擎中的可识别性; 二、重视网站内容的可读性和有价值性: 1、网站内容必须有价值,包括实用性、可用性和可读性; 2、网站整体内容应规范清

Public @ 2023-03-04 01:48:30

日志中显示页面被抓取了,会收录吗?

如果页面已经被抓取并且已经收录在搜索引擎的数据库中,那么搜索引擎可能会更新该页面的索引,以反映新的内容。但是,如果页面被抓取但尚未收录,则需要等待搜索引擎对页面进行评估和选择是否收录。因此,能否收录页面取决于搜索引擎的算法和实际情况。

Public @ 2023-03-28 07:50:10

网站日志的分析是每个SEO人员的必备技能之一

,特别是当你在网站上有行为,搜索结果没有反映时,用网站日志分析来找出隐形的搜索引擎优化问题。 网站日志是记录每一次成功的网站访问的工具,其中包括访问者的IP地址、用户代理、内容类别,以及搜索引擎来抓取您网站的详细信息。分析网站日志可以帮助您获得关于搜索引擎和访客流量状况的许多有用信息,从而对网站进行有效的SEO优化。 日志分析可以描述关于访客行为的细节,因此可以帮助确定网站中哪些元素有利于提高

Public @ 2023-02-26 11:54:31

更多您感兴趣的搜索

0.503089s