百度统计的原理是在网站后台代码中安装一段指定代码,以该代码为检测程序检测每个到访网站的访客的各项数据,并进行统计分析。
该代码检测到访客IP访问网站后向百度统计后台自动传送统计数据,也就是说,是访客到达网站以后才能被百度统计代码检测到。
从另一方面来说,百度统计的数据也是不完全的,有误差的,而未能正常抵达网站的访问数据是不能被检测统计到的。
百度统计基于安装在网站的代码进行检测反馈,对于未能抵达网站的访客自然无法统计到。并且该统计也存在延迟和缺漏,一些抵达网站的数据也可能没有抓取到,所以百度统计的数据相对来说应该是抵达网站的访客中的大部分。
而需要进行抵达率统计的一般是搜索关键词的统计,推广数据的统计,和对主机的检测。那么在百度推广的客服那里,就可以得到账户指定关键词和创意的抵达率,跳出率等准确数据。
用FTP工具可以下载网站后台的系统日志【一般以(.log)结尾的文件】,分析日志中的访客信息,也可以得到大致的抵达率。
网站后台系统日志分析。
服务器日志读取重点
访问时间
被访问的文件地址
搜索引擎蜘蛛或者用户浏览器
访问者的IP
访问状态码
查看访问状态码可以知道具体访客是否正常访问网站,是否有恶意扫描,是否存在404页面等。
如:
200表示成功301永久重定向
403表示没有权限
404表示打不到该页面
500内部服务器错误
503服务器超时