ASP.NET教程:使用.ashx文件去除重复内容

作者佚名技术来源 NET编程浏览发布时间 2012-03-14

不同的链接指向的页面如果具有大量相同的内容，这种现象就会被称为“重复内容”，如果一个网站的重复内容很多，搜索引擎就会认为这个网站的价值不高。所以我们应尽量避免各种重复内容。

动态网站的重复内容常常是由URL参数引起的，而URL重写会恶化这一现象（比较耐人寻味哟，呵呵）。因为如果使用的是原始的URL参数的话，搜索引擎可能会进行适当的判断，而得知重复内容是由URL参数引起的，自动的进行相应的处理；而URL重写会掩盖URL参数，反而使得搜索引擎无法识别URL参数。比如：

原始的URL:
http://www.freeflying.com/articles.aspx?id=231&catelog=blog
http://www.freeflying.com/articles.aspx?id=231&catelog=news

经过URL重写过后的URL：
http://www.freeflying.com/blog/231.html
http://www.freeflying.com/news/231.html

这些URL所指向的页面内容其实是一样的，都是id=231的那篇文章，但这篇文章被blog和news两个栏目所引用，出于各种原因的考虑，我们最终的URL还是如上所示。

处理的办法有两种，一种是利用机器人（robot）协议“排除”其中一个，另一种是通过301将其中一个URL永久重定向另一个URL。

今天我们先讲robot协议。简单的讲，robot指的就是搜索引擎，针对Google，我们又将其称之为“蜘蛛（spider）”。蜘蛛是很有礼貌的，在抓取你的网页内容的之前，会首先征求你的意见。而你和robot之前就基于robot协议进行沟通。具体到实现，有两种方式：

1. 将一个的robots.txt文本添加到网站根目录下，如：

#static content, forbid all the pages under the "Admin" folder
User-agent: *
Disallow: /Admin

#行表示注释；

User-agent指搜索引擎，*表示针对所有搜索引擎，也可以指定具体的搜索引擎，如User-agent： googlebot；

Disallow指定不允许访问的目录或页面，注意：1. 此文本是大小写敏感的；2.必须以“\”开头，表示网站根目录；

和本系列的宗旨一样，我们着重谈ASP.NET技术。所以更多的robots.txt文本的注意事项，请查看http://www.googlechinawebmaster.com/2008/03/robotstxt.html

但我们怎么动态的生成这个文件呢（这种需求其实蛮多的）？可能我们马上想到的就是I/O操作，在根目录下写一个txt文件……，

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务，公司网站：http://www.lingzhong.cn 为了给广大客户了解更多的技术信息，本技术文章收集来源于网络,凌众科技尊重文章作者的版权，如果有涉及你的版权有必要删除你的文章，请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息，谢谢!

1 2 3 下一页

分享到：更多

你可能对下面的文章感兴趣

上一篇: ASP.NET开发:简化应用程序的开发支持Web标准下一篇: 网站开发技术:ASP.NET 2.0搭建网站

关于ASP.NET教程:使用.ashx文件去除重复内容的所有评论

随机推荐