DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   Programiranje (http://www.devprotalk.com/forumdisplay.php?f=23)
-   -   Geotargeted script (http://www.devprotalk.com/showthread.php?t=587)

MorenoArdohain 01. 02. 2006. 23:01

Geotargeted script
 
Hello
potrebni su mi saveti od iskusnijih, ako ih ima :)

Elem, imam mySQL bazu koja sadrzi geotargeted podatke (na osnovu IP adrese daje ostale podatke tipa country, region, city)... baza je poprilicna, 100ak MB sa sve indeksima (1.5 milion recorda)

Ne treba da napominjem da je prilicno spora :)

I sad, naisao sam na projekat u kom treba skoro realtime ispisivati geotargeted podatke, na osnovu IP adrese posetioca.. Server ce trpeti zestoko opterecenje posto je ocekivan broj geotargeted requesta oko 50 hiljada na sat

I imam par ideja kako da ubrzam stvari:
1. baza ce biti u binary formatu
2. koristice se memory cache kako bi se maksimalno ubrzala pretraga za odredjeni IP
3. koristice se Perl radi brzine (koristio bih C kad bih ga znao tako dobro kao perl :)

Zeleo bih da cujem vase predloge i iskustva..
Da li koristiti neka gotova resenja za binary db (tipa DB_File), ili koristiti custom db file, sa fiksnim duzinama polja?
Ili da drzim celu bazu u memoriji? Da li mislite da bi koriscenje C-a znacajno ubrzalo stvari?

Svaka sugestija dobrodosla! :)

marinowski 02. 02. 2006. 09:23

Hm, sve zavisi da li ce masina koja radi na tome raditi i nesto drugo ... 50.000 na sat, dakle, 15 u sekundi, 30-40 u pikovima, nije neki problem ukoliko se kao reprezentacija IP brojeva koristi 32bitni integer. Pretpostavljam da su IP brojevi prezentovani kao opseg od-do u bazi?

Za motivaciju pogledaj http://www.maxmind.com/app/ip_locate , mi koristimo njihovu bazu, i uglavnom smo zadovoljni. Moze se besplatno skinuti GeoIP country. Koriste svoju internu strukturu podataka, postoje API za dosta jezika.

Drugo je pitanje tacnost podataka, uglavnom takve baze prilicno grese. Za SAD je prilicno tacno, za Evropu bas i nije, narocito za nase prostore.

Trece je pitanje update tih podataka, potreban je barem mesecni update da bi se ocuvala kakva-takva tacnost.

robi-bobi 02. 02. 2006. 12:19

MorenoArdohain, jel to neka free baza?
Jel moze link

Ja sam trazio i nasao vrlo malo IP->city takvih. Uglavnom samo za USA.

Ajd da ne otvaram novu temu:
jel ima neko sledecu bazu:
GeografskaSirinaxGeografskaDuzina <-> city :)

evo kako su ljudi to iskoristili: http://woophy.com/map/index.php

MorenoArdohain 02. 02. 2006. 13:18

Nije free, koristi se ip2location baza (www.ip2location.com)

Za zigora: posto je u pitanju ionako projekat namenjen USA trzistu, ne brine me preterano tacnost podataka..
Imamo dedicated server samo za te stvari, tako da cu probati mod_perl ili nesto slicno, a probacu i PHP varijantu, posto vidim da phpads cita binary fajl od maxmind-ove baze..
Uglavnom, mislim da nema nista bez testiranja i experimentisanja :(

zextra 04. 02. 2006. 11:48

Nemoj me shvatiti zdravo za gotovo, ali mislim da koriscenje C-a moze da unese odredjeno ubrzanje, s tim sto je to ubrzanje verovatno zanemarljivo u odnosu na perl, jer perl stvara overhead samo prilikom parsovanja skripte - izvrsenje ide relativno jednako brzo ("relativno" je keyword u ovom slucaju :)).
Off Topic: Dokaz da perl bas i nije tako spor je postojanje, recimo, OpenGL extenzija za isti...

marinowski 04. 02. 2006. 12:11

Citat:

Originalno napisao robi-bobi
Ajd da ne otvaram novu temu:
jel ima neko sledecu bazu:
GeografskaSirinaxGeografskaDuzina <-> city :)

Imas ovde i vise nego sto ti treba: http://gnswww.nga.mil/geonames/GNS/index.jsp
Klikni na FTP skidanje, interesuju te geonames_dd_dms_date_* fileovi, ja konkretno imam geonames_dd_dms_date_20050801.zip ... Pored svih mogucih gradova i sela imas i lokacije kao sto su luke, zeleznicke stanice, pa i Drvni kombinat u Beogradu :)

Procitaj README, da vidis gde se smeju koristiti podaci ...

MorenoArdohain 04. 02. 2006. 14:12

Interesantno..
Nego, kako uopste sajtovi kao sto su MaxMind i Ip2Location prikupljaju te geo podatke?

zextra 04. 02. 2006. 16:07

IP Whois registri kombinovani sa drugim, javno dostupnim bazama...

marinowski 04. 02. 2006. 16:16

Da, za pocetak, a kasnije mukotrpno rucno menjanje uz proveru, posto ima puno nepreciznosti. Interesantno je da se posvecuje paznja i Anonymous Proxyjima, pa se zna ko pokusava biti anoniman dok ti pristupa sajtu.

A ova baza koju sam pomenuo, dolazi sa .mil domena, pa je logicno odakle su skupili te podatke :)

robi-bobi 05. 02. 2006. 09:53

@zigor: veliko hvala, evo idem da citam readme


Vreme je GMT +2. Trenutno vreme je 03:56.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.