一个网站如果”/robots.txt”不存在或者为空文件,那么说明此网站对于所有的搜索引擎robot,该网站都是开放的。
从京东和淘宝的robots.txt文件协议来看,robots.txt文件要讲究语法的.
三个语法
1、User-agent ——用于描述搜索引擎robot的名字,定义搜索引擎类型。
2、Disallow ——不希望被访问的一组URL,定义禁止抓取收录地址。
3、Allow——希望被访问的一组UR。
a、 * 匹配0或多个任意字符。
b、 $ 结束符。
首先写User-agent:
A、U必须大写,后面的小写,紧接着冒号 ——这里还要注意一点:输入法必须调成英文状态,都是英文状态下的)
B、空一格再定义搜索引擎类型。比如定义百度蜘蛛
再写
Disallow ——不希望被访问的一组URL,定义禁止抓取收录地址,或 Allow——希望被访问的一组UR。
Disallow: /(空一格,一撇)
Allow: /(空一格,一撇)
举例:
1. 禁止所有搜索引擎访问网站的任何部分
User-agent: *
Disallow: /
2. 仅禁止Baiduspider访问您的网站
User-agent: Baiduspider
Disallow: /
3.禁止Google索引你的网站。
User-agent: Googlebot
Disallow: /
4.除了百度以外,其他一切搜索引擎禁止索引你的网站。
User-agent: Baiduspider
Allow: /
User-agent: *
Disallow: /
5. 禁止所有搜索引擎访问install这个目录以及install这个目录下的所有文件
User-agent: *
Disallow: /install
6.禁止百度搜索引擎访问admin目录;允许访问images目录。
User-agent: Baiduspider
Disallow: /admin
Allow: /images
7.禁止百度搜索引擎访问网站所有.jpg的图片
User-agent: Baiduspider
Disallow: /*.jpg$
8.禁止百度搜索引擎访问网站所有的图片
User-agent: Baiduspider
Disallow: /*.jpg$
Disallow: /*.png$
Disallow: /*.gif$
9.禁止所有搜索引擎访问admin目录下所有php文件;允许访问asp文件。
User-agent: *
Disallow: /admin/*.php$
Allow: /admin/*.asp$
10.禁止所有搜索引擎索引网站中所有的动态路径。
User-agent: *
Disallow: /*?*
重点区分以下两种:
a、禁止搜索引擎访问faq目录下的所有文件
User-agent: *
Disallow: /faq/
例1:http://www.binweb.cn/faq/1.html 不能访问
例2:http://www.binweb.cn/faq1.html 能访问
b、禁止搜索引擎访问以faq开头的所有文件
User-agent: *
Disallow: /faq
例1:http://www.binweb.cn/faq/1.html 不能访问
例2:http://www.binweb.cn/faq1.html 不能访问
长沙科联环保科技有限公司
长沙科联环保科技有限公司坐落于国家级长沙经济技术开发区,星沙工业园、我们以“科技创新,联合共...南京尚上防腐木
南京尚上防腐木是一家专业致力于加工、制作、销售户外景观防腐木,并为客户设计安装一站式服务的现...长沙昱霆机电有限公司
长沙昱霆机电有限公司是长沙空压机_长沙空压机保养_湖南空压机维修_长沙空压机机头维修-长沙昱...湖南省土地学会,湖南土地学会,湖南土地学会官网
湖南省土地学会是全省土地科技工作者自愿组成,并依法登记的学术性、非盈利性、公益性的法人社会团...湖南为美环保技术有限公司,医疗污水净化机组...
湖南为美环保技术有限公司应“绿水青山就是金山银山”之势而生,秉持“为民环保,美丽干净”理想信...长沙租车公司-长沙鑫晨租车
长沙鑫晨租车(长沙租车网)于2008年,已精工细作多年。现以成为长沙地区较早的租车公司之一。...联系方式
地址:湖南省长沙市天心区韶山南路248号南园503室
电话:13637482004 0731-88571521
网址:http://www.123007.com/
邮箱:123@123007.com
微信咨询
扫一扫进移动端