首页  韩国资源  酷站加油  我的展厅  设计名站  古典元素  推荐下载  设计欣赏  每周专访  招募精英  人才专区  网页教程  平面设计  编程开发  设计竞赛
当前位置:首页 > 网页教程 > 建站杂谈 > 正文
Google
自己被采集之后才开始思考如何防采集
来源:Tom 2007年08月31日 09:36 网友评论:0条 点击:

老实说,做垃圾站的时候经常采集别人的内容,甚至直接用小偷程序。但当自己辛苦做的本地分类信息网站被别人采集时,心里的滋味还是很不好受的。

如今每一个CMS系统都有采集功能,似乎没有了采集网站就做不下去。既然落到自己头上,总是要解决的。花了1个下午的时间,考虑了几种思路,最终用一个简单易行的方法,暂时解决了这个问题。

解决采集主要是下面3个方法:

1、图片输出。
把重要的数据直接作为图片输出,据说起点小说的vip章节就是这样实现的。这个方法非常彻底,缺点是消耗服务器性能和磁盘空间。

2、动态模板。
采集都是通过制定好饿规则,所以如果让被采集页面没有规则,那么依然可以防采集。可以事先做好N套模板,最终效果都挺相似,但是HTML代码结构却不同。比如有一些用<strong>有一些用<B>,有一些用div,有一些用table。每次显示或者输出时随机调用模板。一旦这样,除了“人肉”,基本上可以防住绝大部分的采集程序。

3、利用客户端状态。
利用客户端状态来防止采集也是一种方法。比如要求网有登录之后才能浏览,判断浏览器是否是IE或者firefox,判断是否在1分钟内浏览了超过20或者30页等 。不过现在比较好的程序都能模拟客户端状态,而且本身对很多大站来说是不切实际的。所以一般在论坛中使用的比较多。

由于我的网站核心信息仅仅是联系方式和发布ip地址。所以最终我采用了第一种,直接输出图片并打上域名标记。事实证明效果非常好。由于在程序中做了优化,实际运行时对性能的影响微乎其微。可以到http://www.i0514.cn(如果认为AD,可以不点击)看看最终页面的效果。刷新后会发现图片的微小变化。 (责编:68design03)

上一篇:我眼中的《王通SEO成功的秘密》   下一篇:张鸿春:模式思考--欢迎新站长与我一起探讨
收藏此页】【打印】【关闭
 相关文章  我要点评

免责声明:本站刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。对本文有任何异议,请联络:68design#163.com
转载要求:作者及来源信息必需保留。转载之图片、文件,链接请不要盗链到本站,且不准打上各自站点的水印。



关于我们 | 在线反馈 | 广告报价 | 友情链接 | 联系我们 | 免责声明 | 在线投稿 | 网站地图
Copyright © 2003-2007 68design.net, All Rights Reserve 【找网页设计师,当然上网页设计师联盟】