PDA

Pogčedajte punu verziju : Spider


Vladimir Rodic
24. 08. 2008., 15:29
na strani http://www.nbs.rs/export/internet/cirilica/67/rir.html
postoji forma za izlistavanje svih pravnih lica u Srbiji.
Polje poreski broj je jedinstveno i uvek se sastoji od 9 cifri.
Da li je moguce napraviti pauka koji ce da unosi random od 000000000 do 999999999 u polje poreski broj i da posle toga kupi rezultate i stavlja u bazu.
Dakle u ovom slucaju da li je moguce napraviti pauka koji ce kliktati na polje pretrazi i koliko je to realno s obzirom da postoji mnoooooooooogo pravnih lica, tj. koliko vremena treba takvom programu da prodje kroz celu bazu tj. kroz svih 999999999 upita ?

mileusna
24. 08. 2008., 15:43
Neće baš "kilktati" na pretraži :) ali spajder je u svakom slučaju moguće napraviti.

Sve čemu može pristupiti browser može i automatski spajder, sve dok ne postoji neka zaštita tipa da se prekuca kod sa slike i sl.

ivanhoe
24. 08. 2008., 16:15
nije problem da se napravi tako, ali nije ni najbolje resenje, jer da bi pretrazivao tako morace da proba sve kombinacije od 000000000 do 999999999, tj. da posalje 1000000000 upita sto je potpuno nerealno. Imaju pametnije strategije, ako hoces javi se na PM da te povezem sa drugarom koji ce ti to odraditi brzo i ne preterano skupo..

jablan
24. 08. 2008., 16:30
koliko vremena treba takvom programu da prodje kroz celu bazu tj. kroz svih 999999999 upita ?
Dosta. Ako računaš tipa 10-ak zahteva po sekundi (što je po meni optimistično), trebaće 100M sekundi, što je nešto više od 3 godine.

BTW, ako pogledaš malo postojeće brojeve, videćeš da svi počinju sa 10, što znači da pretragu možeš da svedeš na 10M id-jeva. Takođe, verujem da je poslednja cifra kontrolna, tako da i tu možeš da uštediš red veličine. :)

ivanhoe
24. 08. 2008., 17:56
ne mogu da verujem da 2008 godine sajt Narodne banke ne ume da prikaze nasa slova u adresama, npr. : BRANKA RADIEVIA
Za ovo treba nekog, ne otpustiti, nego poslati u zatvor..:(