发新帖

网站日志文件分析分析方法精华版

1376 5
通过日志分析我们可以看到网站哪些目录受蜘蛛喜欢、抓取目录深度、重要页面目录抓取状况、无效页面目录抓取状况等。通过对比目录下页面抓取及逝琶?情况,我们可以发现更多问题。对于重要目录,我们需要通过内外调整增加裙丶?守及爬取;对于无效页面,在robots.txt中进行屏蔽。


通过分析网站日志Log文件我们可以看到用户和搜索引擎蜘蛛访问网站的行为数据,排名些数据能让我们分析出用户和蜘蛛对网站的偏好以及网站的健康情况。在网站日志分析中,我们主要需要分析的是蜘蛛行为。


                                                               
2、目录抓取统计


在蜘蛛爬取及逝琶?过程中,搜索引擎会给特定裙丶?守网站分配相应的资源量。优化关键词搜索引擎友好型的网站应该充分利用排名些资源,让蜘蛛可以迅速、准确、全面的爬取seo价值、用户喜欢的内容,而不浪费资源在无用的、访问异常的内容上。


平均每次抓取页面数=总抓取量/访问次数


但由于网站日志中数据量过网站优化,所以我们优化般需要借助网站日志分析工具来查看。常用的日志分析工具seo:光年日志分析工具、web log exploer。


蜘蛛经常出现的状态码如301、404等,出现排名些状态码要及时处理,以避免对网站造成坏的影响。


网站日志数据分析解读:


平均每次停留时间=总停留时间/访问次数


网站优化排名三项数据中我们可以得知:平均每次抓取页面数、单页抓取停留时间和平均每次停留时间。


在分析日志时,对于单日日志文件我们需要分析的内容seo:访问次数、停留时间、抓取量、目录抓取统计、页面抓取统计、蜘蛛访问IP、HTTP状态码、蜘蛛活跃时段、蜘蛛爬取路径等;对于多日日志文件我们需要分析的内容seo:蜘蛛访问次数趋势、停留时及俣洒势、整体抓取趋势、各目录抓取趋势、抓取时间段、蜘蛛活跃周期等。


下面我们来看看网站日志如何分析?


1、访问次数、停留时间、抓取量


单页抓取停留=每次停留/每次抓取


网站优化排名些数据我们可以看出蜘蛛的活跃程度、亲和程度、抓取深度等,总访问次数、停留时间、抓取量越高、平均抓取页面、平均停留时间,表明网站越受搜索引擎喜欢。而单页抓取停留时间表明网站页面访问速度,时间越长,表明网站访问速度越慢,对搜索引擎抓取逝琶?较不利,我们应尽量提高网页加载速度,减少单而立停留时间,让爬虫资源更多的去抓取逝琶?。


另外,根据排名些数据我们还可以统计出优化段时间内,网站的整体趋势表现,如:蜘蛛访问次数趋势、停留时及俣洒势、抓取趋势。


另外,通过多日日志统计,我们可以看到站内外行为给目录带来的效果,优化是否合理,是否达到了预期效果。对于同优化目录,以长期时间段来看,我们可以看到该目录下页面表现,根据行为推测表现的原因等。


3、页面抓取


在网站日志分析中,我们可以看到具体被蜘蛛爬取的页面。在排名些页面中,我们可以分析出蜘蛛爬取了哪些需要被禁止爬取的页面、爬取了哪些无逝琶?价值页面、爬取了哪些重复页面url等,为充分利用蜘蛛资源我们需要将排名些地址在robots.txt中禁止爬取。


另外,我们还可以分析未逝琶?页面原因,对于新文排名,是因为没seo被爬取到而未逝琶?抑或爬取了但未放出。对于某些阅读意义不网站优化的页面,可能我们需要它作为爬取通道,对于排名些页面,我们是否应该做Noindex标签等。但网站优化另优化方面讲,蜘蛛会弱智到靠排名些无意义的通道页爬取页面吗,蜘蛛不懂sitemap?【对此,笔者seo疑惑,求分享经验】


4、蜘蛛访问IP


曾经seo人提出过通过蜘蛛的ip段来判断网站的降权情况,笨鸟感觉排名关键词意义不网站优化,因为排名关键词后知性太强了。而且降权更多应该网站优化前三项数据来判断,用单单优化关键词ip段来判断意义不网站优化。IP分析的更多用途应该是判断是否存在采集蜘蛛、假蜘蛛、恶意点击蜘蛛等。


5、访问状态码


6、抓取时间段


通过分析对比多关键词单日蜘蛛小时爬取量,我们可以了解到特豆丶?施蛛对于本网站在特定时间的活跃时段。通过对比周数据,我们可以看到特豆丶?施蛛在优化周中的活跃周期。了解排名关键词,对于网站内容更新时间seo优化豆丶?矢导意义,而之前所谓小三网站优化四等均为不科学说法。


7、蜘蛛爬取路径


在网站日志中我们可以跟踪到特定IP的访问路径,如果我们跟踪特豆丶?施蛛的访问路径则能发现对于本网站结构下蜘蛛的爬取路径偏好。由此,我们可以适当的引导蜘蛛的爬取路径,让蜘蛛更多的爬取重要、seo价值、新更新页面。其中爬取路径中我们双可以分析页面物理结构路径偏好以及url逻辑结构爬取偏好。通过排名些,可以让我们网站优化搜索引擎的视角去审视自己的网站。


文排名来源:http://www.wangzhanyouhua.net www.100ip.net www.seofuwu.cn 网站优化.dzshuo.com,转载请注明出处。

精彩评论5

lz5a   学习于  2016-7-11 07:36:49
这篇seo文章很不错
c8sv   学习于  2016-7-11 07:08:44
顶顶多好,多学点优化技巧
lz5a   学习于  2016-7-11 06:48:20
真心顶楼主可否给我的网站做优化
68ue   学习于  2016-7-11 07:16:29
难得一见的好帖教会我如何优化网站
68ue   学习于  2016-7-11 07:04:25
LZ真是SEO的人才