« 多长的文章有利于网站优化?2009年9月22日深圳新闻集锦 »

网站日志的概念和日志分析的一些技巧

  1、如何查看网站日志?
————————————————————————————
ftp到网站根目录,会有一个带有log字眼的文件夹,如weblog或www_logs,根据需要下载某一天或某段时间或全部的日志文件下来(如果没必要建议不要全部下载,毕竟下载的时候多少还是会占用些服务器带宽,耗费些服务器资源);经查,网站于09年7月19日上线,上线当天即被Yahoo抓取并收录,21日被百度、谷歌抓取并收录

2、如何没有网站日志,是什么情况?
————————————————————————————
如果没有网站日志?如果您谨慎点选择空间提供商的话,一般都有的,如果实在没有,你可以建议服务商启用此功能,如果他硬是不干,那么没辙,吸取个教训,以后选择空间提供商的时候先考察清楚再做决夺。

3、如果日志里,HTTP状态码很多是404,怎么办?
————————————————————————————
还真有404呢,不过不多,如下:
2009-07-21 00:25:11 W3SVC52 *.*.*.* GET /robots.txt - 80 - 123.125.64.13 Baiduspider+(+http://www.baidu.com/search/spider.htm) 404 0 2
2009-07-21 00:27:04 W3SVC52 *.*.*.* GET /robots.txt - 80 - 123.125.66.50 Baiduspider+(+http://www.baidu.com/search/spider.htm) 404 0 64
2009-07-21 07:43:07 W3SVC52 *.*.*.* GET /****/stat.js - 80 - 119.123.7.36 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1)+;+.NET+CLR+1.1.4322;+.NET+CLR+2.0.50727;+.NET+CLR+3.0.04506.30) 404 0 2
————————————————————————————
这些404应该不是很要紧的事情吧,我决定随后用robots.txt屏蔽掉一些文件夹

发表评论

为了防止SPAM,含链接的评论需要审核后才能显示。

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

网站收藏