DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   PHP (http://www.devprotalk.com/forumdisplay.php?f=9)
-   -   Pracenje produktivnosti posetioca (http://www.devprotalk.com/showthread.php?t=10599)

squirll 15. 12. 2011. 15:10

Pracenje produktivnosti posetioca
 
Pozdrav, treba da scripta izracunava produktivnost(viewpages) za posetioce sa jednog reff-a...
E sad ja bi trebao zapisivati ip tog korisnika i koliko je on stranica pogledao u 24H ...
Problem je ovde sto se ocekuje velika poseta (preko 10k uniqe u minuti) i da to zapisujem sve direktno u bazu ubilo bi je.
Razmisljao sam prvo da belezim u memcache i kad istekne 24H da to iz cache ubacim u bazu, ali tu nastaje drugi problem, sto nece 100% biti tacno racunanje produktivnosti.

Da li je neko slicno radio ili ima ideju kako ovo da resim a da budu svi zadovoljni? :)

webarto 15. 12. 2011. 15:17

Možeš li pojasniti to viewpages, treba ti za svakog posjetioca "putanja", šta je klikao, kad i ostalo? Za koji period?

ivanhoe 15. 12. 2011. 16:59

parsiraj serverske logove

squirll 15. 12. 2011. 19:48

webarto - treba mi tacan broj stranica koje je korisnik posetio na tom domenu u proteklih 24H. samo to, ne zanima me u koje vreme niti koliko se zadrzao..samo koliko je stranica ucitao...

ivanhoe - nije losa ideja, samo moram proveriti koliko log fajl moze da bude veliki...Ima mozda neka clasa za tako nesto? :)

salebab 15. 12. 2011. 21:16

Mislim da ako se nalaziš na serveru (ili cloud) koji podržava 10k poseta u minuti da ti neće biti problem jedan INSERT upit po zahtevu? Zar ne? Ili skaliraš mysql? :)

ivanhoe 15. 12. 2011. 22:51

Druga, jos jednostavnije varijanta je da koristis neku NoSQL bazu, tipa mongoDB. Uzasno su brze za upis posto baferuju podatke u memoriji, 10k zahteva u minuti nije nikakav problem.

A mongo je extremno jednostavan za upotrebu, i na sajtu imas primer za upotrebu mongoDB kao log sistema koji se vrlo lako da preraditi u to sto tebi treba...

squirll 16. 12. 2011. 10:30

ivanhoe, to mi reci :) ja sam citao/skontao da su NoSQL baze brze/bolje za SELECT upite...al izgleda da sam krivo citao
a ovo je odlicna prilika da se oprobam u NoSQL-u :) svidja mi se :)

sad se razmisljam da kombinujem mysql+mongo ili samo mongo? write bi isao u mongo a read u mysql. ...preporuka?
I jel moz neko da kaze koliko mu zauzece servera sa mongo bazom i koliko otp ima posetioca?

ivanhoe 16. 12. 2011. 15:17

ovo moje nema za sad puno hitova, 10-tak u sekundi u peak periodima, ali zato server load na small instanci na EC2 sa apache-php-mongoDB setupom (prakticno bez ikakve optimizacije) retko predje 0.2.

Utvara mi kaze da na http://newscurve.com/ oni teraju node.js + mongoDB i da to razbija koliko je brzo. Pominjao je neke stotine upita u sekundi, zaboravio sam tacnu cifru, ali secam se da je zvucalo kao jako puno :) Isto tako sve na obicnom hardware-u, nikakva zver...

jablan 16. 12. 2011. 15:18

@squirll: Kako misliš write u mongo a read u mysql?

squirll 16. 12. 2011. 16:28

@jablane, pa u mongo ide write i tamo sumira podatke i onda taj sum jedna cron scripta prebaci u mysql...
sta dobijem s tim...pa umesto 1000insert query-a u mysql ide jedan, i ako pukne neka baza druga moze da nastavi sa radom normalno (znaci sajt ce biti delimicno aktivan)

ili da sve prebacim u mongo?A posto radim u CI-u onda moram vijati i mongo classe...

ivanhoe 16. 12. 2011. 17:22

ima smisla koristiti 2 baze ako ocekujes jak traffic da ne bi opterecivao bazu select-ima (ne znam kako tacno radi locking u mongu, trebalo bi proveriti). Ali mozda ti je lakse da repliciras monga, postoji dobra podrska za to, a mogao bi i o shardingu da razmislis...

Sto se selecta tice, ako ti ne trebaju komplikovani join-ovi mongo je sasvim jednostavan i brz, tako da sa te strane nema razloga da ga izbegavas...

misk0 16. 12. 2011. 20:44

Citat:

Originalno napisao ivanhoe (Napišite 103672)
ima smisla koristiti 2 baze

noSQL baze nisu u svemu bolje od RDBMS, tako da se slazem sa ovim.


Citat:

(ne znam kako tacno radi locking u mongu, trebalo bi proveriti)
Mislim da locking radi na nivou dokumenta, da ne moze sitnije.

ivanhoe 16. 12. 2011. 22:27

ja sam vise mislio 2 baze generalno, nebitno koje, cisto da ne pises i citas iz iste, jer te operacije smetaju jedna drugoj, a replikacija to elegantno resi

ali svakako se slazem da noSQL ima i prednosti i mana u odnosu na relacione baze, mada mnogo tih mana moze da se resi i pametnim dizajnom scheme... ali treba uvek birati alat prema konkretnoj situaciji, naravno...

squirll 16. 12. 2011. 22:35

Ja sam ipak odlucio da idem na Mysql i Mongo, na mongo ce ici write i nesto selecta (tipa dal je taj user vec bio na sajtu i sl), a na mysql ce ici drugi deo, koliko je ukupno korisnik bio, koliko je procitao stranica, registracije, banovi i sl ...
Tako da necu opteretiti niti jednu bazu previse a i u slucaju da jedna ispadne iz sistema druga moze da gura sama koliko toliko ...
I mozda najvaznije stvar je sto neam pojma mongo tako da ce mi biti vatreno krstenje, i strah me da ceo sajt bude na mongo. No bice vec sledeceg meseca slicnih i vecih projekata tako da mozda neki buduci bude na jednoj bazi :)
Jel ima neko neki artikal da mi preporuci tip quick mongo tips i sl? :)

ivanhoe 16. 12. 2011. 23:18

ja sam samo mongodb manual citao i sasvim je dovoljno (za osnovne operacije bar, ja samo trackujem neke bannere).. umesto sql-a u klijent konzoli koristis javascript, prilicno je prosto.. ako ces iz php-a da pristupas, mi smo koristili mongo extenziju sa PECL-a, lako se instalira i metode su skoro identicne kao one u mongo js konzoli, pa je prosto...

ako hoces mogu da obesim primere kako se cita i pise iz php-a?

squirll 16. 12. 2011. 23:29

video sam i ja to, ima na njihovom sajtu lepa dokumentacija , ako se neko nadje u slicnoj situaciji kao ja evo par linkova da ne trazi previse

"Konvertovanje" SQL-a u noSql
http://www.mongodb.org/display/DOCS/...+Mapping+Chart

PHP instalacija (upotreba PHPa i Monga ima na php manual sajtu)
http://www.mongodb.org/display/DOCS/PHP+Language+Center

Alternative phpmyadmina za mongo naravno
http://www.mongodb.org/display/DOCS/Admin+UIs

CI za Mongo
http://codeigniter.com/forums/viewthread/162420/#885550

Ja sam mislio jel ima par brzih trikova za optimizaciju i na sta treba obratiti paznju i sl ...

ivanhoe 17. 12. 2011. 11:29

nisam se udubljivao u optimizaciju, nije mi trebalo, sve mi je radilo super sa fabrickim podesavanjima za moje potrebe.

Jedna fora koja dobro dodje ako radis sa brojacima (a koliko sam razumeo radis), je sto u mongu mozes jednom komandom da insertuje record i updejtujes brojac (nesto kao INSERT .. ON DUPLICATE KEY UPDATE u mysql-u, stim sto se ovde gleda ceo record, ne samo index):
PHP kôd:

    $conn = new Mongo('localhost');
    
// select the database
    
$db $conn->baza;
    
// insert $data ako vec nema takav record ili inkrementuj brojac ako postoji
    
$cond = array( '$inc' => array('cnt' => 1));
    
$db->tabela->update($data$cond, array('upsert' => true)); 


djipko 17. 12. 2011. 12:28

Mongo je po mom iskustvu idealan za bas takav use-case koji si napomenuo jer su write-ovi bolesno brzi, a i selectovanje ako pravilno izaberes indekse tako da ti mozda i ne treba cron.

Ono sto je meni kad sam prvi put koristio "NoSQL" bilo najneprirodnije je sto je filozofija iza njih - best effort - dakle ti mu bacis gomilu podataka a on ce se sa time snaci, ili mozda nece, nemas pojma, a ako te zanima bas jako pogledaj logove. Nema exception, integrity, bla bla

Tako da ako ces ga koristit "in production" na zivom sajtu - dobro osmisli monitoring.

Citat:

Originalno napisao ivanhoe (Napišite 103691)
nesto kao INSERT .. ON DUPLICATE KEY UPDATE u mysql-u, stim sto se ovde gleda ceo record, ne samo index):

Ovo je takozvani kultni "upsert" :)

squirll 21. 12. 2011. 01:33

ova mongodb biblioteka za CI nema upsert opciju(mozda je posle dodam) pa sam mislio prvo select pa ako ima taj ip onda update a ako nema onda insert...e sad me brine jel bi taj jedan vise SELECT mogao da stvori problema/opterecenje?

ivanhoe 21. 12. 2011. 03:41

nije problem toliko u opterecenju, nego sto mongo koliko ja znam nema locking, tako da postoji mala, ali potencijano nezgodna situacija da ti to pukne: uradis select, drugi zahtev upise isti taj record, ti probas da ga insertujes, to ne uspe i nisi zabelezio taj record. Zato je upsert jako kul, jer on radi atomski.

ja bih ti savetovao da jednostavno ubacis svoju podrsku za upsert direktno i da radis sa njim... pogotovo ako su perorfmanse bitne uvek treba smanjiti broj wrappera...

squirll 22. 12. 2011. 21:44

Izgleda da meni mongodb nece moci uraditi to sto mi treba....
Situacija, belezim ip posetioca, preko kojeg referrala je dosao, kad je dosao i dal je prvi put a ako nije koliko je puta dosao u 24H
UPSERT ovde pada jer sta ako je IP isti ali drugi reff i sl.. u prevodu nikad nemam 100% iste podatke(teoretski a u praksi imam)
Ok ajd to nije problem, raspodelim ja u vise collection-a
U jednoj zapisujem samo IP i referral i koliko je puta posetio stranicu, a u drugi colection belezim ostale podatke... ALI tu nastaje drugi problem, kako da znam dal je uradio update ili insert...

P.S ne mogu da IP ili referral stavim UNIQE jer dolazim na ono staro..sta ako je vec ip bio a reff nije isti...

MorenoArdohain 22. 12. 2011. 22:30

Ne znam sto bi morao da upisujes koliko je puta dosao u 24h.
Moj predlog ti je da sve posete "trpas" u collection, a da jedan script iz crona svakih xx minuta radi obradu tih podataka i snima statistiku u drugi collection.

ivanhoe 23. 12. 2011. 01:52

Mislim da je problem u tvojoj logici, da bi to trebalo da radis ovako:
Kôd:

db.test.log.update(
    {ip: '12.34.56.70'}, // ovo je uslov za update: WHERE IP=neki_ip
    {  // ovo su akcije koje treba uraditi:
        $inc: {counter:1}, // inkrementuj counter
        $set:{nesto:'abc', ip: '12.34.56.70'}, // setuj vrednost ovih polja, stavis tu sva polja koja treba setovati
        $addToSet: {ref: 'http://blabla.com'} // u niz ref dodaj vrednost referera
    },
    true // ovo je upsert flag, true znaci da ukoliko ne nadje record uradi insert
);

Pisem iz glave, ali tako nekako to ide (izbaci samo ove komentare, ne znam jel radi sa njima)... ovim dobijas objekat koji sadrzi broj pristupa sa odredjenog IP-ja i niz svih referera sa kojih je taj IP dosao. Ako ti treba da znas koliko puta je dosao sa kog referera, onda ne mora ovako nego samo snimas svaki objekat sa (ip, ref) kombinacijom i radis klasicni upsert, a onda koristi map-reduce da od toga dobijes i zbir po IP-jevima. Ali koliko sam razumeo to nije bilo ono sto si hteo?

Pogledaj obavezno dokumentaciju za UPDATE na MongoDB sajtu, tamo sve ovo pise... imas tamo objasnjeno i kako da proveris da li se desio update() ili insert() prilikom upserta, tako da samo RTFM ;)

djipko 27. 12. 2011. 11:38

@squirll A jel postoji neki razlog zasto ne mozes da koristis cookie umesto IP-ja?

Elem mongo ce ti ako se ne varam matchovati i po vise kriterujama pa mozes u drugu liniju koda koji je ivanhoe napisao da ubacis i affiliate/refferal/kao kriterijum i onda ce upsert raditi samo ako se oba poklapaju.

squirll 27. 12. 2011. 17:16

nisam pisao neko vreme jer nisam hteo biti dosadan :) elem skontao sam upsert kako radi (malo cudno, tj sto je ivanhoe rekao , logika u mojoj glavi se nije bas poklapala) napravio sam upsert bas tako da trazi po vise kriterijuma i sad je ok ..
A za cookies, da koristicu i cookie ali mora i IP ... nije to samo sto sam ja ovde napisao, mnogo du stvari se racuna/pamti/pise i moram sto vise podataka o korisniku da imam...


Vreme je GMT +2. Trenutno vreme je 12:03.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.