Želite da proverite da li je stranici pristupio bot, čovek ili nepristojni bot koji se predstavlja kao npr. Google.
Ono što je sigurno moguće jeste proveriti da li je bot zaista onaj bot koji se predstavlja da jeste.
Ovo su funkcije za proveru. Funkcija isBot vraća tri vrednosti a)ime bot-a, b)false i c)null. False vraća ako se bot lažno predstavlja a null ako nije bot.
Time smo rešili da li je bot zaista bot koji se predstavlja. Problem je kako proveriti ako nije bot da li je zaista čovek ili mašina.
Ako se mašina predstavlja kao čovek većina skriptova nema mogućnost izvršavanja JavaScript koda unutar programskog okruženja u kome su pisani tako da ne mogu izvršiti Ajax skript koji se nalazi u HTML body tag-u i poziva se onload funkcijom koja šalje naziv učitane stranice ka serveru na dalju analizu.
//PHP funkcije
function isBot( $http_user_agent = null, $ip = null ) {
if( $ip == null ) { $ip = $_SERVER['REMOTE_ADDR']; }
$bots = array(
array( 'name'=>'Google', 'bot'=>'http://www.google.com/bot.html', 'domain'=>'googlebot.com' ),
array( 'name'=>'Media-google', 'bot'=>'Mediapartners-Google', 'domain'=>'googlebot.com' ),
array( 'name'=>'Baidu', 'bot'=>'http://www.baidu.com/search/spider.htm', 'domain'=>'crawl.baidu.com' ),
array( 'name'=>'Yahoo', 'bot'=>'http://help.yahoo.com/help/us/ysearch/slurp', 'domain'=>'crawl.yahoo.net' ),
array( 'name'=>'Msn', 'bot'=>'http://search.msn.com/msnbot.htm', 'domain'=>'search.msn.com' ),
array( 'name'=>'Teoma', 'bot'=>'http://about.ask.com/en/docs/about/webmasters.shtml', 'domain'=>'ask.com' ),
array( 'name'=>'Alexa', 'bot'=>'Alexa Verification Agent', 'domain'=>'amazonaws.com' ),
array( 'name'=>'TweetmemeBot', 'bot'=>'TweetmemeBot', 'domain'=>'favsys.net' )
);
$http_user_agent = strtolower( $http_user_agent );
foreach( $bots as $bot ) {if( stripos( $http_user_agent, $bot['bot'] ) !== false ) {
$isBot = checkBot( $bot['domain'], $ip );
if( $isBot ) { return $bot['name']; }
else if( $isBot === false ) { return false; }
}
}
return null; // obavezno pravi razliku izmedju false i null, false je lažni boot dok je null human
}
function checkBot( $domain, $ip ) {$name = gethostbyaddr( $ip );
$host = gethostbyname( $name );
if( strpos( $name, $domain ) ) {
if ( $host == $ip ) { return true; }
else { return false; }
}
}
//HTML body tag u npr. index.php
<body onload='loadSuccess("<?php echo $_SERVER['REQUEST_URI']; ?>")'>
//JavaScrip funkcija koja poziva Ajax
function loadSuccess( $reques_uri ) {
xmlHttp=GetXmlHttpObject();
var url = "analyse/load_success.php";
var params = "page="+ $reques_uri;
xmlHttp.open("POST",url,true)
xmlHttp.setRequestHeader("Content-type", "application/x-www-form-urlencoded");
xmlHttp.setRequestHeader("Content-length", params.length);
xmlHttp.setRequestHeader("Connection", "close");
xmlHttp.send(params);
}
Detaljnije...