网站日志分析,是SEO数据分析中最重要的工作之一,我们可以在网站日志中分析出很多有用的信息,比如通过网站日志分析:蜘蛛爬取了哪些页面,返回的状态码是什么,能及时发现蜘蛛喜欢爬取网站的那个栏目的内容、不喜欢爬取什么内容、以及排查404 500等页面
那么怎么分析网站日志呢?下面就让合肥SEO自媒体来分享一下自己分析网站日志的经验吧。
1.下载日志
登陆FTP服务器后台,或者直接通过网站管理面板后台下载网站日志,下载到桌面rizhi文件夹。
2.导入EXCEL
打开一个空的EXCEL,点击:数据-导入外部数据-导入数据
选择日志文件,
点击:打开,
选择分隔符,下一步。
选择空格,下一步,点击完成。 选中第一行1的位置,点击:数据-筛选 这样日志就被我们用EXCEL完整分隔开了。
3. 查看百度访问记录
开始,查找和选择,输入baidu,点击“查找全部”。就可以查到百度的所有访问记录了。
4. 查看访问robots记录
在大约F栏的位置,GET /„„在右上角的倒三角的位置找到robots相关的项目,然后点击确定就把所有的robots访问记录筛选出来了。
5. 查看谷歌访问的文件与访问时间。
开始-查找,找到所有谷歌访问记录,然后观察谷歌访问网站的记录,如果长期观察,找到了搜索引擎每天访问的时候,算好时间,可以在不用外链的情况下发送新内容被秒收呢。
6.搜索引擎抓取情况
从日志中,可以看到搜索引擎抓取了什么页面,这样就能在robots.txt中添加不想蜘蛛抓取的页面和提交死链。
7. 查看网站访问状态码。
在G的位置有200等代码,我们可能筛选不同的代码,查找不同的代码是因为访问什么文件产生的结果。
网站返回状态码
1、200代码,表示蜘蛛爬取正常
2、404代码,访问的这个链接是错误链接
3、301代码,永久重定向
4、302代码,表示临时重定向
5、304代码,客户端已经执行了GET,但文件未变化。
6、500代码,表示网站内部程序或服务器有错
8. 网站日志的访问包括但不局限于上面的内容,
比如rar文件被下载,被植入病毒,访问时间,访问IP,某个文件被访问次数,等等信息都可以通过日志清楚得看到。
关于日志方面的内容,今天就分享到这里了,希望大家通过本文的日志分析讲解,学会对日志分析工具的使用,学会通过EXCEL分析网站日志,同时希望大家通过对日志的分析,能对网站有更好的掌控,以使我们的SEO工作达到最佳效果。
转载请注明:本文《合肥seo:利用EXCEL轻松分析网站日志》链接: http://seo.leidu.net/post-81.html
百度已收录
已有 2/3836 人参与
评论:
发表评论: