什么是robots协议,wordpress网站的robots协议怎么写
发布:smiling 来源: PHP粉丝网 添加日期:2015-02-28 20:55:03 浏览: 评论:0
网站的robots协议也可以叫做爬虫协议,通过这些协议可以告诉搜索引擎蜘蛛网站的哪些内容可以抓取,哪些不能抓取。具体解释可以参照百度百科。关于wordpress网站的robots协议,八猫做了详细的梳理。这里感谢悦听有声站长的分享。
1.什么是robots协议
网站的robots协议也可以叫做爬虫协议,通过这些协议可以告诉搜索引擎蜘蛛网站的哪些内容可以抓取,哪些不能抓取。具体解释可以参照百度百科。关于用法,其实很简单。写好robots.txt写好之后,把robots.txt协议上传到网站的根目录。这样每次搜索引擎抓取的时候就会遵循robots.txt协议上的内容进行抓取。不过需要注意的是:
robots.txt在书写的时候一定要谨慎,因为不够谨慎的话导致网站收录收到影响。比如下面这句:Disallow: /。phpfensi.com
这个指的是不允许抓取网站上所有的内容。注意斜杠之前要有一个空格。包括其他的Disallow也是。一定要有空格,这个才是正确的robots写法。
2.wordpress网站如何使用书写robots协议
关于wordpress网站的robots协议,八猫做了如下汇总。这是悦听有声的站长分享出来的。简单说下 User-agent: 搜索引擎的名称。其他的可以具体看。
- User-agent: *
- Disallow: /wp-admin/
- Disallow: /wp-content/
- Disallow: /wp-includes/
- Disallow: /feed
- Disallow: comment-page-*
- Disallow: trackback
- Disallow: /?s=*
- Disallow: /*/?s=*
- Disallow: /?p=*
- Disallow: /?p=*&preview=true
- Disallow: /?page_id=*&preview=true
- Disallow: /wp-login.php
- User-agent: MJ12bot
- Disallow:/
- User-agent: Adsbot-Google
- Disallow: /
- User-agent: Feedfetcher-Google
- Disallow: /
- User-agent: Yahoo! Slurp
- Disallow: /
- User-agent: Yahoo! Slurp China
- Disallow: /
- User-agent: Yahoo!-AdCrawler
- Disallow: /
- User-agent: YoudaoBot
- Disallow: /
- User-agent: Sosospider
- Disallow: /
- User-agent: Sogou spider
- Disallow: /
- User-agent: Sogou web spider
- Disallow: /
- User-agent: MSNBot
- Disallow: /
Tags: robots协议 wordpress协议
推荐文章
热门文章
最新评论文章
- 写给考虑创业的年轻程序员(10)
- PHP新手上路(一)(7)
- 惹恼程序员的十件事(5)
- PHP邮件发送例子,已测试成功(5)
- 致初学者:PHP比ASP优秀的七个理由(4)
- PHP会被淘汰吗?(4)
- PHP新手上路(四)(4)
- 如何去学习PHP?(2)
- 简单入门级php分页代码(2)
- php中邮箱email 电话等格式的验证(2)