阅读背景:

Robots.txt 协议详解及使用说明_aifeier1982的博客

来源:互联网 
一、Robots.txt协议
Robots协议,也称为爬虫协议、机器人协议等,其全称为“网络爬虫排除标准(Robots Exclusion Protocol)”。网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。也既是Robots的用法有两种,一种是告诉搜索引擎哪些页面你不能抓(默认其他的就可以抓);一种是告诉搜索引擎你只能抓取哪些页面(默认其他的不可以抓)。 Robots协议,也称



你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: