
为什么要分析网站日志
网站日志分析是SEO中的高级部分,一般来讲,在前期优化过程是没有必要分析,当然你也可以看看网站日志当中有没有被搜索引擎爬取的可能,如果你的网站没有被相关搜索引擎爬取,那么就需要进一步分析和改进了,具体下面我们来说说为什么要分析网站日志,分析网站日志能够给我们带来什么样的改变。
1)掌握IP来源
IP我们之前已经有过相关解释,其实别看简单,深入了解其中原理还是挺难的。在我们的服务器日志中,我们可以看以清楚的看到,某一天某一个时间段,甚至时分秒都可以确定这个IP的访问时间,之所以需要查看IP来源,主要还是分析这个IP是否是真是有效的,或者说是否是搜索引擎来抓取的IP,因为有些IP可能是假的搜索引擎爬虫IP,这就需要进行处理了,可以在服务器端进行屏蔽,一旦进行屏蔽就不能在访问了,减轻了服务器压力。
说明一下,网站日志有很多种,比如访问日志分析、错误日志分析等等,根据需要进行设置,这里我们通常是分析访问日志。除此之外,服务器受到攻击或黑客入侵的时候,我们也可以从网站日志IP中得到答案。
2)访问页面状态码是否正常
我们从网站日志中可以得出某个页面是否访问正常,而不需要一个一个页面去看,这让省我们很多时间,一个比较完善的网站日志中是有状态码反映出来的,如果访问错误则返回的是404,这个我们以前讲过,如果访问是正常的,则返回的是200状态码。
先来一段网站日志访问结果反馈,如下所示:
110.249.201.241 - - [02/Jan/2022:00:03:56 +0800] "GET /SEOgj/1883.html HTTP/1.1" 200 7823 "-" "Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; Bytespider; https://zhanzhang.toutiao.com/)" "syu5028300001.my3w.com" "text/html" "/usr/home/syu5028300001/htdocs/SEOgj/1883.html" 992
从上面可以看出,这个是今日头条蜘蛛来爬取得,IP是河南地区的,返回状态是200,属于正常的访问,通常我们也可以得出访问了哪个页面。
3)了解哪个搜索引擎蜘蛛来爬取
一个比较重要的数据,就是可以了解哪种搜索引擎蜘蛛来爬取,比如你限制了某个搜索引擎蜘蛛的爬取,从网站日志中可以分析出,这种限制是否有用,或者你发现某种搜索引擎蜘蛛不想你想要的,为了缓解服务器压力,可以限制这种搜索引擎抓取,同时我们还可以通过UA头进行辨别。
以百度为例,百度搜索引擎UA头通常分为三类,一个是移动端,一个是PC端,另一个是小程序。比如移动端的UA头通常是这样:
"Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"
查看网站日志
不同的服务器类型可能产生的网站日志位置不一样,但是其格式是一样的,都是.log结尾的文件,一般字段类型也是一样,该有的数据字段都会有,如果需要自行配置,可以根据官方教程进行配置,一般像虚拟主机都是已经配置好的,在根目录外有相关的服务器日志目录,如果需要分析某一个时间段的日志,可以从服务器上面下载。
具体的服务器类型查看方式,我们在日后的文章中详细讲解。总之,网站日志分析是网站优化过程中必不可少的一步,也是高阶优化的必经之路,通过网站日志分析,我们可以了解整个网站的优化问题。
顶一下
(0)
踩一下
(0)