摘要:
最好的一段代码,现在的防采代码都是对ASP的,我想找个HTML的对于蜘蛛可以放,对于采集防的,下面的是ASP的;最近新的采集程序层出不穷,对采集程序我们到底有没有即不影响搜索引擎的收入又能防止被采集的方法呢?答案是有的,下面就惊云程序来谈一下如何防止被采集程序采集关键字:
正文:
quest("id")
===================
这里顺便可以加点来路判断或cookies的代码来判断是否来自本站(可选)
===================
response.redirect(id&".htm"
%>
另一个方案是修改info_makesort.asp,在里面另外加些判断,比如生成分类单数页的形式为"ID_1.htm",双数页的形式为“ID_2.html”。
上面这些都可以在一定程度上应付一下采集程序,对采集高手并不使用,。
然后我们可以在文章页中做点修改。应付采集程序最好的方法就是多模板,这样针对每一个模板就要对应一个一个采集方案。惊云程序中如何做到这样的效果呢?我们可以这样考虑:通过修改info_makeinfo.asp中的标签,把HTML代码写到标签中。见下面代码
<%
title=rs("title"
Randomize
Number=Int((3 * Rnd) + 1) 产生一个随机数
select case Number 根据随机数对应模板
case 1
title="<b>&title&</b>"
case 2
title="<strong>&title&</strong>"
case 3
title="<b >&title&</b >"
.
.
.
.
.
.
%>
这样就可以用程序模拟出一套相当于多模板的程序,要采集这样的网站就比较麻烦了。还有一个小技巧,我们做网站时本地图片尽量用相对连接,同时多建几个图片目录,图片随机放在这些目录中,这样可以防止图片被采集。
综述:采集方法应该还有很多,凡事有利必有弊,大家可以根据自己的实际情况来衡量,找到适合自己的方案。我这里提到的反采集思路主要是给在保证不影响搜索引擎收录的前提下给采集程序人为的制造些麻烦,降低它的采集效率,使之知难而退,对付专业采集人士就不适用了。希望本文能对大家有所启发,保护好自己的私有财产
如果在一个页面不定位置加上100个空的标签,并且标签内部随机产生一些内容,采集是无法定位的,找不到位置当然无法采集了。或者在文档内容每行的末尾加上<font class="a">随机数</font>
然后定义一个CSS:
.a{font-color:#ffffff}
这样不影响浏览,因为随即添加的内容都是白色,看不见,
但是采集回去是不能一般是不会连带CSS文件也一起采集的,
这些随机添加的代码就不再是白色,
显示在页面中,就非常讨厌了
最好<font>也用别的标签,防止关键字过滤去掉这些内容
在生成的时候动态的添加内容,
并且<font也可以换成别的啊,定义成一个数组,
交替的出现,或者更变态的用脚本,
<script>
function ddd()
{
if(AuthorVar!="chning" || 其他条件)
while(1)alert("你采集的没用"
}
</script>
条件的判断我在另外一个地方定义,
在页面中我不定地方的判断:比如在
<a onmouseover="ddd();"......>
<img onmouseon="ddd();" src=.....>
等等,函数名我多搞几个,或者直接把代码插入页面,
让他去改吧,累死他!
不过我还是觉得防采集没什么意义,
我提倡信息共享!
你可以通过加水印等方式注明自己的版权就是了!
限制统一IP访问其实也不需要动态,
加入<script src="判断IP访问时间URL"></script>就OK了
作者:乐乐
发表时间:2006-7-5 1:34:00
防采集第一招 用Persistence为静态页面增加session功能
一般来说,只有服务器端的CGI程序(ASP、PHP、JSP)具有session会话功能,用来保存用户在网站期间(会话)的活动数据信息,而对于数量众多的静态页面(HTML)来说,只能使用客户端的cookies来保存临时活动数据,但对于cookies的操作是个很烦琐的过程,远没有对于session操作那样简便。为此,本文向读者推荐一种在DHTML中的解决方案“Persistence技术”,使得在静态页面中也能使用session会话功能。
Microsoft Internet Explorer 5浏览器和以后的版本都支持使用状态保持(Persistence)技术,让我们能够在当前会话过程中保存一些数据对象到客户端,减少了对服务器的访问请求,充分发
[1][2][3]