这个是我学习SEO中遇到的最难学的一些技术活了,但是没办法,还是要掌握。因为SEO优化中必须用到;
robots.txt的书写
robots上一篇我们有讲到,就是搜索引擎的机器人,百度要做蜘蛛,而robots.txt就是和这些机器人对话的语言。例如我们的网站还没有建设完成时,就不想让搜索引擎来到网站页面抓取内容,因为是再建设中,网站很多内容还没有确定下来,如果召来搜索引擎抓取,就会本人为网站不稳定,对延长后期网站收录的时间,还有就是我们网站的后台有很多信息也不想让搜索引擎看到,像登录信息等机密信息,所以在这个时候,就需要给搜索引擎下一个指令,明白告诉它,我的网站现在正在建设,请稍后再来。
robots.txt的一般写法如下:
User-agent: *
Disallow: /admin/
Disallow:
/old/love/
Disallow: /007.html
以上信息对搜索引擎说明 网站的admin登录信息不能抓取,007.html网页不能抓取,如果网站所有的内容都不想被搜索引擎抓取就写成
User-agent: BaiduspiderDisallow: /
User-agent: baiduspider
Disallow: /
这个写法是淘宝全面封杀百度蜘蛛的写法,我们可以照抄下来的。
写完后保存为.txt格式,上传到ftp网站的根目录下就可以了。
评论(2)
老师,为什么我那个用wordpress建的站,用的是这个文件.htaccess做的静态化,怎样才能修改这个虚拟的robots.txt呢,一定要用插件吗
不是虚拟的,就是一个文本文件,名字叫robots