DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   Code snippets (http://www.devprotalk.com/forumdisplay.php?f=46)
-   -   Did You Mean API (http://www.devprotalk.com/showthread.php?t=9844)

webarto 27. 03. 2011. 18:33

Did You Mean API
 
Nije API, ali radi, barem za mene :)
http://webarto.com/80/did-you-mean-api

Najbolje je učitati preko AJAX posle pretrage, recimo ako ukuca "cannon" vjerovatno je da neće dobiti što traži. Takože "20d" i "20 d" su za SQL različite stvari, naravno ima načina i to da se sredi ali kad već ima Google... :1074:

PHP kôd:

/**
 * @author Webarto.com
 * @copyright 2011
 * @url http://webarto.com/
 * @version 0.1
 */

class DYM{

    function 
check($query){
        
$url "http://www.google.com/search?q=".str_replace(" ""+"$query);
        
$html $this->curl($url);
        
        
preg_match('#spell>(.*?)</a>#is'$html$matches);
        if(
$matches){
            
$spell strip_tags($matches[1]); 
            return 
$spell;
        }
        
    }

    private function 
curl($url){
        
        
$ch curl_init();
        
curl_setopt($chCURLOPT_URL$url);
        
curl_setopt($chCURLOPT_RETURNTRANSFER1);
        return 
curl_exec($ch);
        
curl_close ($ch);
    
    }



Upotreba:

PHP kôd:

$q urldecode($_GET["q"]); //nikon eos 20d

$dym = new DYM;
$spell $dym->check($q);
if(!empty(
$spell)){
    echo 
"Did you mean: $spell"//Did you mean: canon eos 20d



Peca 27. 03. 2011. 19:29

ali... ako se sa jedne IP adrese urade stotine upita za kratko vreme.....

zar ne moze preko nekog Google API key-a da se uradi ovo?

webarto 27. 03. 2011. 19:47

Mislim da to ne bi bio problem, jer ovo je klasični Google.com odnosno pretraživač. Što se tiče API mislim da nema (zato sam ja stavio API da bude malo "SEO"), ima google spell checker api, i sad se može iskombinovati nekako da se dobije ovako, ali opet mislim da je ovo bolje jer ovo nije klasični spell check, zato što "zna" da je 20D Canon a ne Nikon.
Stvarno ne znam, ja sam ukucao "did you mean api" ali na prvoj stranici nije bilo ništa konkretno pa sam ovo napravio začas.

Vrijeme učitavanja...

Did you mean: canon eos 20d 0.606
Did you mean: canon eos 20d 0.609
Did you mean: canon eos 20d 0.595
Did you mean: canon eos 20d 0.598
Did you mean: canon eos 20d 0.604

Peca 27. 03. 2011. 20:11

pa, bio bi problem.
recimo da ugradis ovo na svoj sajt - i da 100 posetioca za 5 minuta urade pretragu - i tvoj sajt posalje 100 upita googlu za 5 minuta - banovali bi IP servera na kome ti se hostuje sajt - i onda ovo vise ne bi radilo.

webarto 27. 03. 2011. 20:23

Evo pokušao sam 5x po 20x... i sada radi. Ne kažem da nisi u pravu ali šta je tu je. Za spell check API ima 5000 riječi dnevno.

Citat:

1. canon eos 20d 0.59 s
2. canon eos 20d 0.79 s
3. canon eos 20d 0.58 s
4. canon eos 20d 0.8 s
5. canon eos 20d 0.58 s
6. canon eos 20d 0.59 s
7. canon eos 20d 0.59 s
8. canon eos 20d 0.59 s
9. canon eos 20d 0.59 s
10. canon eos 20d 0.58 s
11. canon eos 20d 0.59 s
12. canon eos 20d 0.59 s
13. canon eos 20d 0.58 s
14. canon eos 20d 0.59 s
15. canon eos 20d 0.59 s
16. canon eos 20d 0.6 s
17. canon eos 20d 0.58 s
18. canon eos 20d 0.58 s
19. canon eos 20d 0.59 s
20. canon eos 20d 0.59 s

Peca 27. 03. 2011. 20:29

ako bi pokusao razlicite upite verovatno bi te saseko :)
ovako ti servira kesh, pa ga ne ugrozavas puno :)

webarto 27. 03. 2011. 20:45

Toliko ne znam, može biti, javiću uglavnom ako me banuju... opet :)

akubra 28. 03. 2011. 10:22

Sitna napomena, curl_close se nikad ne izvrsi:

Citat:

Originalno napisao webarto (Napišite 96720)
PHP kôd:

   ...
        return 
curl_exec($ch);
        
curl_close ($ch);
    
    }





webarto 28. 03. 2011. 22:29

^ aaa pa nije valjda toliki fail, nisam gledao kad sam kopirao :) Bez obzira mislim da se kompletan $ch i ostale varijable unutar funkcije uništavaju automatski po izvršenju funkcije.

webarto 12. 05. 2011. 07:56

A sada i 3x brži (scraping mobilne verzije)...

http://webarto.com/80/did-you-mean-api

PHP kôd:

/**
 * @author Webarto.com
 * @copyright 2011
 * @url http://webarto.com/
 * @version 0.2 (11.05.2011)
 */

class DYM{
    
    function 
check($query){
        
$url "http://www.google.com/m?q=".str_replace(" ""+"$query);
        
$html $this->curl($url);
        
        
preg_match('#<a class="p"(.*?)>(.*?)</a>#is'$html$matches);
        if(
$matches){
            
$spell strip_tags($matches[2]); 
            return 
$spell;
        }
    }
    
    private function 
curl($url){
        
$ch curl_init();
        
curl_setopt($chCURLOPT_URL$url);
        
curl_setopt($chCURLOPT_ENCODING"gzip");
        
curl_setopt($chCURLOPT_RETURNTRANSFER1);
        
$data curl_exec($ch);
        
curl_close($ch);
        return 
$data;
    }
    


Kôd:

nikon eos 20d -> canon eos 20d 0.214
nikon eos 20d -> canon eos 20d 0.274
nikon eos 20d -> canon eos 20d 0.225
nikon eos 20d -> canon eos 20d 0.225
nikon eos 20d -> canon eos 20d 0.258



Vreme je GMT +2. Trenutno vreme je 06:42.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2017, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.