首页 美女贴图 网络日记 重庆租房 搜索指南 网络电视 飘网音乐 飘网博客 精彩网址 友情链接 飘网地图 本站留言
飘网中国
专题:网络营销 | 网站设计 | QQ技巧 | 搜索优化 | 菜鸟进阶 | 病毒攻防 | 网络技术 | 系统应用 | 本站作品 | 常用软件 | 工具软件 |
飘网中国>>网站设计>>正文

HTML防采集代码或程序

编辑: 来源: 更新:2006-8-1 点击:
【字体:

摘要:最好的一段代码,现在的防采代码都是对ASP的,我想找个HTML的对于蜘蛛可以放,对于采集防的,下面的是ASP的;最近新的采集程序层出不穷,对采集程序我们到底有没有即不影响搜索引擎的收入又能防止被采集的方法呢?答案是有的,下面就惊云程序来谈一下如何防止被采集程序采集
关键字:
正文:
最好的一段代码,现在的防采代码都是对ASP的,我想找个HTML的对于蜘蛛可以放,对于采集防的,下面的是ASP的

<%
Dim AppealNum,AppealCount
AppealNum=10                                                 同一IP60秒内请求限制10次
AppealCount=Request.Cookies("AppealCount") 
If AppealCount="" Then
response.Cookies("AppealCount")=1
AppealCount=1
response.cookies("AppealCount").expires=dateadd("s",60,now())
Else
response.Cookies("AppealCount")=AppealCount+1
response.cookies("AppealCount").expires=dateadd("s",60,now())
End If
if int(AppealCount)>int(AppealNum) then
response.write "抓取很累,歇一会儿吧!"
response.end
End If
%>

第二种

<%
user_agent=Request.ServerVariables("HTTP_USER_AGENT")
http_reffer=Request.ServerVariables("HTTP_REFERER")
server_name=Request.ServerVariables("SERVER_NAME")
检查当前用户是否是蜘蛛人
function check(user_agent)
allow_agent=split("Baiduspider,Scooter,ia_archiver,Googlebot,FAST-WebCrawler,MSNBOT,Slurp",",")
check_agent=false
for agenti=lbound(allow_agent) to ubound(allow_agent)
if instr(user_agent,allow_agent(agenti))>0 then
check_agent=true
exit for
end if
next
check=check_agent
end function
if check(user_agent)=False then
if http_reffer="" or left(http_reffer,len("http://"&server_name)+1)<>"http://"&server_name&"/" then
%>
<html><body>
<form action= name=checkrefer id=checkrefer method=post>
</form>
<script>
document.all.checkrefer.action=document.URL;
document.all.checkrefer.submit();
</script>
</body></html>
<%response.end
end if
end if
%>


作者:乐乐
发表时间:2006-7-5 1:33:45

防止被采集的代码!

最近新的采集程序层出不穷,对采集程序我们到底有没有即不影响搜索引擎的收入又能防止被采集的方法呢?答案是有的,下面就惊云程序来谈一下如何防止被采集程序采集,希望对大家有所帮助。欢迎大家一起讨论。
首先,惊云程序的软件下载采集中采集到的地址一般都是“down.asp?id=XXX”,这样的地址无实用价值,可以不做考虑,剩下的就是惊云文章了。
采集信息一般有2种方案,一种是根据ID,从1开始到最大ID。对付这个比较简单,我们可以通过修改生成HTML的文件名来防止。一般默认的都是“ID.htm”形式,我们可以改为“ID_日期.htm”的形式,这样就没办法采集。还有个方案就是在生成的html页中不出现该文章所在分类,这样采到的信息就不完整,无实用价值。另一种方案是根据分类页获取采集列表,现在大部分采集系统都是用这个方案来采集。对付这个我们首先可以从分类页着手,使采集程序无法获取采集列表。这里我想到了2个方案,一个是修改info_makesort.asp,把文章列表的连接形式改为"redir.asp?id=ID",然后新建一个redir.asp网页做转向。
<%
id=trim(re
[1][2][3]
上一篇:解决:能上QQ,却不能浏览网页
下一篇:2006上半年十大恶性病毒防杀的办法
最新文章 更多
推荐文章 更多
热门文章 更多
© 2005-2010 飘网中国 版权所有
站长邮箱:①LCC-749AT163.com ②FlymornATgmail.com(AT改为@)
如转载时,请注明出处;本站部分资源来自网络,如有侵权,请来信说明;飘易文章系统 HTML版.
渝ICP备05000119号