很多人有些日志的习惯,这样可以记录自己每天对这个世界的感受,真的是一个很好的想法.可惜小川不能坚持下去,没有几篇像样的日志。闲话少说,其实网站也是有自己每天的“日志”的,这些日志记录了每天被浏览、被编辑,被搜索引擎抓取等很多信息,但是网站的日志并不是用汉语或是英语写的,而是用其独有的HTTP代码表示的.

如果我想查看小川SEO网站的日志可以这么做:
通过FTP网站上传工具,在网站目录下找到文件名为“log”的文件,然后下载解压里面的记事本.txt即可.但需要注意的是,很多服务器的情况不太一样,所以这个日志记录功能不是统一的,有的甚至没有日志功能,如果没有也不需要担心,找自己的服务商,让他帮你下载就可以了.
日志的内容也不近相同,下面是Baiduspider(百度蜘蛛)百度搜索引擎的一段HTTP返回码,我们可以对其分析理解:

例:61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)”
解:61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] 这一段“61.135.168.22”为抓取网页的服务器IP地址,[11/Jan/2009:04:02:45 +0800]为抓取时间和时区区间了.
GET /bbs/thread-7303-1-1.html HTTP/1.1 “GET”在这里是抓取的意思,bbs/thread-7303-1-1.html HTTP/1.1这个就是所抓取的页面.
200 8450 “200”为抓取成功返回码,提示抓取8450个字节的内容.
“Baiduspider+(+http://www.baidu.com/search/spider.htm)”最后面这话可以解释为抓取者,这里为“百度蜘蛛”.
注意:很多的日志显示是不尽相同的,例如有的返回码显示为200 0 0或200 0 64 ,这也是抓取成功的意思.

从日志里我们还可以看到那些被关进沙盒的文章,还可以看到搜索引擎的抓取频率,有的网站抓取频率很大,可以达到秒收的效果,搜索引擎的抓取频率越高说明网站的收录效果越好.

本文由SEO优化编辑提供,转载请注明!
编辑日期:2011-08-04

声明:本站分享的WordPress主题/插件均遵循 GPLv2 许可协议(免费开源),相关介绍资料仅供学习参考,实际版本可能会因版本迭代或开发者调整而产生变化,如程序中涉及有第三方原创图像、设计模板、远程服务等内容,应获得作者授权后方可使用。本站不提供该程序/软件的产品授权与技术服务,亦不收取相关费用。