Optimizacija baze - da li odvajati u novu tabelu?
Oduvek me je interesovala optimizacija baze podataka i stalno slušam svakakve "cake" za poboljšanje performansi.
Da li je skuplja operacija pronalaženja tabele (u moru tabela) i izvršavanje jednostavnog upita nad manjom tabelom (sa manje unosa i manje polja) ili izvršiti jedan upit nad većom tabelom? Da li je uopšte skupa operacija pronalaženja same tabele u ogormnoj bazi. Drugo pitanje, na koji način biste realizovali sistem notifikacija (kao fb recimo) gde imamo nekoliko hiljada korisnika online koji na 1 sekund izvršavaju upit nad tom tabelom (ili tabelama)? A opet potrebno je u tu tabelu često ubacivati. Ok, ta tabela (ako je jedna) ne bi imala više od 3 polja i ne bi imala mnogo unosa jer bi se stariji arhivirali u drugu tabelu koja bi se zvala tek po potrebi. Da li je to jedino što se može učiniti. Šta predlažete? Treće pitanje je vezano za chat sistem i kako optimizovati taj deo baze. I ako možete da se ograničite samo na mySQL :) Hvala |
Ne postoji 'silver bullet' koji rjesava sve probleme tj 'najoptimalnija varijanta za sve'. Uvijek je rijesenje zavisno od konkretne situacije tako da bi bilo bolje da dodjes sa konkretnim tabelama, upitima, upisima, frekvencijom i slicno pa ti se onda moze i pomoci.
Facebook mislim da koristi Cassandra-u tj noSQL bazu podataka gdje su pravila drugacija. |
Citat:
Dakle, onako kako bih ja resio pomenuti problem: 1) Prvo pogledas sadrzaj tih tabela, da li sva polja koja pretrazujes moraju biti tu? Da li su tipovi polja optimizovani u odnosu na sadrzaj tabele? Npr ako za neko checked 0/1 koristis int, to znaci da trosis 3 bajta po polju vise nego sto treba, pa puta milion slogova = 3MBajt ... veca tabela = sporija tabela 2) Koristi fiksne tipove kada je to moguce, npr za smestanje ip adresa bolje je koristiti char nego varchar polje (brze je). Not null bi trebao biti brzi od Null polja itd. 3) Koristi indexe i explain za optimizaciju istih :) 4) Ako imas puno upisa/citanja istovremeno predji na innodb, u nasem slucaju pokazao se mnogo bolje od myisam (low level locking) 5) Bolji hardware Citat:
|
Citat:
Kôd:
mysql> SELECT INET_ATON('192.168.10.50'); |
Kazu :) I kako onda dobijes jedan pool? Npr :
Kôd:
select whatever where ip like '192.168.%'; PHP kôd:
Kôd:
select whatever from foo_table where date_field = current_date(); |
Ako imas mogucnosti da furas nesto drugo osim MySql, istrazi non-relational baze tipa MongoDB, Cassandra ili Redis (key-value dbs).. Imas boljih resenja koje po performansama tuku MySQL nekoliko desetina puta (procackaj benchmark testove na netu). Jedina caka je sto ce ti trebati vise vremena da udjes u stos, pogotovu ako si dosad radio samo sa relational bazama.
|
Citat:
|
|
@MorenoArdohain
Dobro bre pusti coveka da prvo nauci MySQL, nemoj odmah te razne Kasandre, Ljovisne, Madres egoistas ... |
Dzabe uci MySQL ako nece moci da mu izgura zahteve :)
|
Hmm... znam da bi neko noSQL rešenje bilo bolje. Iskreno nisam to nikad radio i ne znam ni kako se instalira. Opet, projekat bi bio na nekom shared hostingu (u pocetku). Koliko je komplikovana instalacija takve baze i da li je to uopšte moguće na shared hostingu?
@dinke Hmm, notifikacija bi trebalo da stoji i do 2 dana zapamćena. Jesi siguran da bi Memcache bilo dobro rešenje? EDIT: ma nije meni problem da naučim Kasandru, brzo bih ja ušao u štos, nego da se ne zalećem bezveze ako mi neće rešiti problem. |
Citat:
|
Ako vec planiras da vrtis aplikaciju koja treba da izgura nekoliko hiljada korisnika istovremeno kao sto si pomenuo u prvom postu, naravno da neces koristiti shared hosting :)
|
Citat:
|
Generalno svi shared hostinzi imaju boljku sa MySQL-om.
|
ovde sam postavio uputstvo kako da napraviš notifikacije kao na Facebook-u i da do milje volje dodaješ novih notifikacionih opcija.
|
Citat:
To naravno zavisi od toga kako se te tabele koriste, ako je samo mali podskup postojecih tabela u stalnoj upotrebi, recimo za nekakvu log arhivu, gde se radi na poslednjem logu, a ostali se cuvaju za svaki slucaj, to je dobro resenje. Isto i za slucaj shardinga, jer tad svaki server otvara samo jednu od shardovanih tabela, cak iako postoje kopije svih postojecih (ako se ide na takvo resenje da se tabele razlicito zovu) Ako imas uniformniji pristup tabelama, onda je frka. Svojevremeno sam imao taj problem sa WPMU, jer on pravi zaseban set od 10-tak tabela za svaki blog, sto je ok radilo do negde 3000 blogova, a onda je krenulo da naglo puca, jer su ljudi posecivali blogove random redom i mysql je svo vreme trosio na otvaranje i zatvaranje tabela i ucitavanje i brisanje keseva, i trebalo mu je po par sekundi za request. Tacna cifra posle koje krenu problemi zavisi od servera, memorije, kolicine podataka, broja requesta, itd.. |
Ja sam gurao MyBB forum sa peak 1000 korisnika istovremeno, na home made serveru ( 2ghz dualcore + 4gb ram) i load je bio 1-2%. Isti taj forum je blokirao čitav server na hostmonster i hostgator pa su suspendirali account, paket je bio unlimited i to.
Tako da ako ne planiraš nešto x puta veće ne brini toliko o optimizaciji. |
Svako će da ima svoj savet, ali generalno sve zavisi od strukture baze, upita i nekih druguh stvari ... nekada je bolje sve držati u 1 tabeli, nekada i nemaš izbora jer je alternativa ipak sporija a često je efikasnije da se razbije u nekoliko manjih tabela. Ne postoji OPŠTE REŠENJE koje je primenjivo svuda i u svakoj situaciji.
|
Opšte rešenje je da se počne školski, sa normalizovanim podacima, pa se deli, duplicira i šarduje kad za to nastane potreba.
|
Opšte rešenje je da se sedne pre nego što se počne pa se odluči šta će da bude normalizovano a šta denormalizovano ... pa se menja usput samo ako vidiš da postoji bolje rešenje a ne da počneš sa nečim što znaš da ćeš menjati "kada nastane potreba" ;)
|
Pozdrav svima nakon duzeg vremena :)
@Igor: koliko sam shvatio tvoje potrebe, ti jos nemas tacno definisan koncept tvoje aplikacije - dakle moras koristiti agilne metode pri razvoju te aplikacije, sto samo po sebi iskljucuje donosenje odluke o konacnom izgledu/dizajnu/strukturi aplikacije i baze. Kao sto rece neko (misk0 cini mi se) - ne postoji "silver bullet" rjesenje, nego ces morati zagrijati stolicu, te metodom "trial & error" (odnosno "generate & test" iliti "guess & check") doci do najoptimalnijeg rjesenja. Evo ti par usputnih savjeta onako iz rukava: - gledaj da ti broj tabela ne predje broj korisnika ;) , znaci tabele kreiraj svrsishodno i ne razbacuj se - rasporedi tabele u vise grupa i imenuj ih sa odgovarajucim prefixom (chat_*, user_*, i td.), radi lakseg pregleda - ako mozes, koristi particije - npr. particioniras tabelu sa korisnicima po pocetnom slovu imena/prezimena ili po godini rodjenja; particioniras tabelu sa chat porukama po datumu (Oracle ima i mogucnost kompozitnog particionisanja, pa mozes prvo particionisati po datumu i onda subparticionisati po korisnickom ID-u, tj. "Range-Hash composite partitioning" ili drugacije, zavisi o konceptu tvoje aplikacije); ne znam kakvo je stanje sa MySQL-om po pitanju particionisanja, jer sam totalno zapostavio MySQL zadnjih godina :( - koristi indexe kada ti je "selectivity" za zadane kolone veoma visok - koristi full table scan, kada imas neku batch job operaciju, koja obradjuje veliki broj redova u zadanim tabelama - koristi uskladistene procedure itd. Eto nabrzaka nesto, cisto da se vratim u forumsku formu. ;) |
Vreme je GMT +2. Trenutno vreme je 18:01. |
Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.