限制爬虫

分类:PHP | 作者:凹凸曼 | 发表于2011/02/25 限制爬虫已关闭评论
<?php
define('NOROBOT', TRUE);     //爬虫开关   TRUE:开启
getrobot();
if(defined('NOROBOT') && IS_ROBOT) {
exit(header("HTTP/1.1 403 Forbidden"));
}
/**
*  判断是否爬虫
* @return : bool    TRUE:为爬虫
*/
function getrobot() {
if(!defined('IS_ROBOT')) {
$kw_spiders = 'Bot|Crawl|Spider|slurp|sohu-search|lycos|robozilla';
$kw_browsers = 'MSIE|Netscape|Opera|Konqueror|Mozilla';
if(!strexists($_SERVER['HTTP_USER_AGENT'], 'http://') && preg_match("/($kw_browsers)/i", $_SERVER['HTTP_USER_AGENT'])) {
define('IS_ROBOT', FALSE);
} elseif(preg_match("/($kw_spiders)/i", $_SERVER['HTTP_USER_AGENT'])) {
define('IS_ROBOT', TRUE);
} else {
define('IS_ROBOT', FALSE);
}
}
return IS_ROBOT;
}
?>

 本文出自 “凹凸曼” 博客,请务必保留此出处http://www.apoyl.com/?p=213

Tag:

日志信息 »

该日志于2011-02-25 01:42由 凹凸曼 发表在PHP分类下, 评论已关闭。

目前盖楼

抱歉,评论被关闭

« »