蜘蛛池知识

热门推荐
网站优化为企业网络的推广和发展提供了创新机会
网站SEO整合了企业营销以帮助盈利网络转型
致力于网络优化技术的开发,以加强公司的在线营销生态系统
互联网推广处于黄金时代,网站优化必不可少
流行减少,在线营销增加,强调一站式网站推广外包的价值
营销市场发生了变化,在线SEO推广的效果增强了
网站优化技术是企业网络营销转型的核心动力
在在线促销时代,网站优化和企业在线营销如何同时赋予这两种方式?
顺应网络营销改革的大趋势,网站的优化和推广为企业网络的转型而生。
企业网络转型步伐加快,网站优化营销潜力巨大

如何分析网站日志?掀起网站优化热潮!

只是做SEO。如果您不知道如何分析日志,那么您会发现我会秘密告诉您。对数分析与中药的脉搏分析相同。您仍然必须随时提供自己的网站。紧紧抓住脉搏,别忘了开个处方并为网站做出诊断报告。处方正确药物的时机已到。如果您想要网站的稳定发展,则它更符合SEO优化规则。网站的日志分析和诊断必须是不想执行此工作的SEO。 ,注定的事情。

  所谓的网站日志,并不会同你想象中的那么深奥...就是通过各个搜索引擎下的蜘蛛,通过域名爬去网站的轨迹和痕迹,就成为传说中的“网站日志”这样一说是不是更好理解了。

  一、如何对网站日志进行分析和诊断?

  1、总访问次数

  蜘蛛对网站的访问次数可以间接反映网站的权重,为了有效提升蜘蛛访问次数,需要在服务器性能、深层外链建设、层级结构、入口添加等方面进行分析优化

  2、总停留时间

  蜘蛛停留时间与网站结构、服务器响应时间、网站简洁的代码、网站内容更新等有很密切的关系

  3、总抓取量

  蜘蛛抓取量与网站结构、网站内容更新、服务器cookie设定等有密切的关系。蜘蛛抓取量与网站的收录直接相关,抓取量越大意味着网站收录可能越多

  4、单次访问抓取量

  蜘蛛单次抓取的页面数量多,说明网站有价值内容多,并且网站结构利于搜索引擎蜘蛛的抓取

  5、单页抓取停留时间

  单页抓取停留时间与页面加载速度、页面内容信息量、页面代码简洁度等有密切关系,提高网页加载速度,减少蜘蛛单页停留时间,提升蜘蛛总抓取,进而增加网站收录,提升网站整体流量

  6、目录抓取

  蜘蛛主要抓取的目录应该与网站的重点栏目一致,为了提升重点栏目的收录、权重及关键词排名,需要从外链、内链等角度调整SEO策略;针对不需要收录或者抓取的栏目,需要使用robots禁止抓取

  7、页面抓取

  蜘蛛在网站停留时间有限,搭建良好的网站结构,为重点页面建设入口,减少页面的重复抓取率,将蜘蛛引入更多不同的页面,有利于提升网站的收录

  8、状态码

  清除页面中的死链,有利于蜘蛛顺利爬行页面,提升搜索引擎友好度。

  二、网站日志下载及设置注意事项!

  1、首先我们的空间要支持网站日志下载,这一点是很重要的,在我们购买空间之前必须要先问好支不支持网站日志下载,因为有的服务商是不提供这项服务的,如果支持的话空间后台一般都有日志WebLog日志下载这个功能把它下载到根目录在用FTP传到本地就可以,服务器的话可以设置将日志文件下载到指定路径。

  2、这里有个很重要的问题,网站日志强烈建议设置成每小时生成一次,小型的企业站和页面内容较少的网站可以设置成一天,它默认是一天,如果内容多或者大型站设置成一天生成一次,那么一天只生成一个文件,这个文件会相当的大,我们有时电脑打开是会造成死机,设置的话找空间商协调设置即可。

  三、网站日志的分析。

  1、日志的后缀名是log的我们用记事本打开,选择格式里的自动换行这样看起来方便,同时用搜索功能搜索BaiduSpider和Googlebot这两个蜘蛛。

  例如:

  百度蜘蛛 2012-03-13 00:47:10 W3SVC177 116.255.169.37 GET / – 80 – 220.181.51.144 Baiduspider-favo ( baidu /search/spider ) 200 0 0 15256 197 265

  谷歌机器人 2012-03-13 08:18:48 W3SVC177 116.255.169.37 GET /robots.txt – 80 – 222.186.24.26 Googlebot/2.1 ( google /bot ) 200 0 0 985 200 31

  拆分解释:

  2012-03-13 00:47:10 蜘蛛爬取的日期和时间点;W3SVC177 这个是机器码这个是惟一的 我们不去管它;116.255.169.37 这个IP地址是服务器的IP地址;GET 代表事件,GET后面就是蜘蛛爬取的网站页面,斜杠就代表首页,80 是端口的意思,220.181.51.144 这个IP则是蜘蛛的IP,这里告诉大家一个鉴别真假百度蜘蛛的方法,我们电脑点击开始运行输入cmd打开命令提示符,输入nslookup空格加蜘蛛IP点击回车,一般真百度蜘蛛都有自己的服务器IP而假蜘蛛则没有。

  如果网站中出现了大量的假蜘蛛则说明有人冒充百度蜘蛛来采集你的内容,你就需要注意了,如果太猖獗那会很占用你的服务器资源,我们需要屏蔽他们的IP.

  200 0 0这里是状态码 状态码的意思可以在百度里搜索下;197 265最后两个数字则代表着访问和下载的数据字节数。

  2、我们分析的时候先看看状态码 200代表下载成功,304代表页面未修改,500代表服务器超时,这些是一般的其他代码可以百度一下,对于不同的问题我们要处理。

  3、我们要看蜘蛛经常爬取哪些页面,我们要记录下来,分析他们为什么会经常被蜘蛛爬取,从而分析出蜘蛛所喜欢内容。

  4、有时候我们的路径不统一出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这里我们就发现了搜索引擎是可以判断我们的目录的,所以我们要对我们的目录进行统一。

  5、我们分析日志分析时间长了,我们能够看出蜘蛛的抓取规律,同一目录下面的单个文件的抓取频率间隔和不同目录的抓取频率间隔都可以看出来,这些抓取频率间隔时间是蜘蛛根据网站权重和网站更新频率来自动确定的。

  6、蜘蛛对于我们的页面的抓取是分等级的,是根据权重依次递减的,一般顺序为首页、目录页、内页。

  7、不同IP的蜘蛛他们的抓取频率也是不相同的

  四、那么通过网站日志我们能知道什么?

  1、我们发的外链是否起到效果 ?

  2、我们买的空间是否能够稳定 ?

  3、蜘蛛对我们的那些页面比较喜欢而对哪些不喜欢 ?

  4、蜘蛛什么时候抓取我们的网站频繁,我们需要什么时候更新内容 ?

  而这些问题其实我们可以通过我们的服务器IIS日志可以简单的分析出来,作为一个合格的SEO, 要真正会分析IIS日志才可以而不是简单的去看看状态码,

文章作者:SEO文章标题:网站日志如何分析?带动网站优化走一波!本文地址: 复制链接