接着谈网站流量统计分析的问题。
除了要查看非常细微的东西或者怀疑抓取有问题,一般我也不会人工去看原始日志文件,一大长串的数据实在使很难辨认。
通常做流量统计分析会使用现成的软件,一般有两种。
一是在网页中插进一段代码,比如JavaScript代码,这段代码会自动检测访问信息,并把这个信息写入信息库中。
属于这类最值得推荐的就是Google Analytics,这个服务以前是要付费的,被Google买下后免费提供给站长,而且不需要在网页上显示Google的任何标记,统计信息也很全面。更好的消息是前几天Google刚取消了邀请制,也就是任何人只要有gmail就可以使用Google Analytics了。
这类中文流量统计服务,像太极链,51yes,itsun。声明:这些服务我一个也没用过,只是看到很多人在用。至于是否适合你的网站,请自行判断。
第二种方式是用软件直接对原始日志文件进行分析。这种软件把日志文件作为输入,直接统计信息。既可以装在服务器上,也可以运行在自己电脑上。
装在服务器上常见的有Webalizer,AWStats,Analog,这几个软件在我们用的CPanel中都已经预装了。可以运行在自己的电脑桌面的如Azure Web Log analyzer。
最著名的一个流量统计分析工具是WebTrends。
这些流量软件统计一般会给出这些信息:
按月,日甚至小时列出的独立IP地址(unique visits),通常认为这个数字是访问你网站的人数。除非Modem重开IP地址一般是不变的,同一个人多次访问时,会被统计为一个人。
总访问数(total visits),这个数字就包含了同一个人多次访问。
网页访问数(pageview),一个人访问一个网站通常都会访问多个网页。
Hits,全部文件被访问的次数,这包括了网页文件,图片文件,JS文件等等所有文件。因为这些图片文件等的原因,Hits的访问数会比pageview大。
访问者所在地理位置会按不同的国家列出,访问者的IP地址。
搜索引擎蜘蛛访问的次数。
具体网页被访问的次数,你可以看到被访问最多的前十页或前二十页,你也可以按次数列出所有的网页。
用户的操作系统,浏览器类型等。
来自搜索引擎的流量统计,按不同的搜索引擎分别列出次数。
访问者来自哪些网页(referrer),比如来自其他搜索引擎或来自其他网站的链接。
访问者找到你的网站所搜索的关键词。