DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   SQL baze podataka - Sponzor: Baze-Podataka.net (http://www.devprotalk.com/forumdisplay.php?f=10)
-   -   SQL (sve baze) = nema binarne pretrage? (http://www.devprotalk.com/showthread.php?t=676)

bojan_bozovic 15. 02. 2006. 09:32

SQL (sve baze) = nema binarne pretrage?
 
Palo mi je u oci da zbog DELETE upita mozete imati primarne kljuceve koji nisu po redu, tj da RDBMS ne moze da vrsi binarnu pretragu po primarnim kljucevima = mora da prolazi kroz sve recorde - imate ih milion - milion. Idealno je da se izsortira pa vrsi binarna pretraga, ali to ne moze ako svi kljucevi nisu prisutni, tj imate bar jedan koji fali+dobro je da su po redu ako ih mnogo ima. Flatfile db koji je dobro dizajniran uz binarnu pretragu ima da bije SQL kad je pretraga po primarnim indeksima po sredi - a za sve ostalo ne moze biti sporija jer takodje mozemo da napravimo virtuelnu tabelu, izsortiramo po koloni i vrsimo binarnu pretragu. Naravno da za komplikovaniji upit (dovoljno je WHERE NAME="Pera") mora da se prolazi kroz celu bazu. Zeleo bih malo da prodiskutujem o ovome, mada ne spada u SQL vec dizajn samog RDBMS. Naravno, ovde mislim na flatfile db koji nije na Perlu ili sl. jezicima vec npr. C/C++

Edit: prakticno pri trazenju po primarnom kljucu ne moze da otpadne sortiranje, sto je problem za veliku bazu. Mnogo bi bilo bolje da nema uopste DELETE upita i da su indeksi po redu.

Pedja 15. 02. 2006. 09:52

Citat:

Originalno napisao bojan_bozovic
Flatfile db koji je dobro dizajniran uz binarnu pretragu ima da bije SQL kad je pretraga po primarnim indeksima po sredi - a za sve ostalo ne moze biti sporija jer takodje mozemo da napravimo virtuelnu tabelu, izsortiramo po koloni i vrsimo binarnu pretragu.

Uvek stojim kod misljenja da je svaki RDBMS rezultat dugotrajnog rada velikog broja eksperata u oblasti RDBMS, a to je nauka za sebe (sa sve gomilom high-tech matematike i teorije) i da je malo verovatno da jedan covek moze da na brzaka napravi nesto sto moze da se meri sa optimizovanoscu i tacnoscu rada RDBMS.

S druge strane, svaki RDBMS, na kraju krajeva, radi sa datotekama, razlika je smao u tome da li korsinik datteokama pristupa direktno ili preko servera.

Uzmimo na primer FoxPro DMBS, koji se po karakteristikama i mogucnostima moze meriti i sa naprednijim SQL serverima, a radi na flat file sistemu.

bojan_bozovic 15. 02. 2006. 10:08

Svaki RDBMS pise u fajl. Ne znam sta si zeleo reci za FoxPro?

Samo moram reci da se moze zabiti nos u istu matematicku teoriju, uz priznavanje cinjenice da PC igra ne moze da koristi RDBMS za smestanje podataka (ne mislim tu na teksture i modele, vec na podatke o samoj igri koji se menjaju, a ima ih mnogo). BTW RDBMS pise sve na disk uz logovanje, mozes primeniti i logovanje transakcija cak, mada kome to treba, uz podatke smestene u memoriji, takodje. jel' ti je velicina baze manja od velicine memorije? Ako jeste, sve u memorju pa menjaj i trazi podatke. To RDBMS ne moze. (MySQL moze sa HEAP tabelama, ali da li je onda to brze od direktnog pristupanja podacima, bez overheada za konekciju sa bazom?) Transaction safe baza mora da loguje sve na disk da ako negde pukne, podaci ne budu ugrozeni. Tu je pisanje na disk vrlo sporo. Prakticno, dobro napravljena (tu je teorija nuzna!) flatfile baza moze da bije SQL zato sto ti ne treba logovanje na disk, uspostavljanje konekcije sa serverom i sl., pod uslovom da ne moras da otvaras bazu svakicas (CGI)
Ovo mi je palo na pamet zato sto RDBMS podrzava mnogo toga sto nije potrebno na Webu (transakcije npr. snapshote, strane kljuceve i sl.) ako se to izbaci iz izoptimizuje mislim da bi to moglo biti nesto brze od MySQL, a svakako, uz manji load na serveru.

Pedja 16. 02. 2006. 12:21

Ja sam tvoju prvu poruku razumeo kao ideju da mozes da napravis RDMBS umesto RDBMS-a pa sam ti tako i odgovorio. FoxPro sam naveo kao primer RDBMS koji radi nad flat tabelama.

E sad, ova tvoja druga poruka potpuno menja smer diskusije. Tebi dakle ne treba RDBMS nego ti treba nesto slicno ali specificno uz poprilicna ogranicenja, odnosno nesto sto je baza podataka u prilicno sirokom smislu te reci (toliko sirokom da recimo svaki niz mozemo smatrati bazom).

Ak pravis igricu i treba ti da u memoriji baratas podacima, onda moras razviti svoj sistem, koji ce sigurno raditi brze od RDBMS iz par razloga od kojih najvise uticaja ima to da se radi o specificnom resenju koje je optimizovano da radi samo taj konkretan speicifican posao u specificnim i vidoko kontrolisanim uslovima. RDBMS-u u toj situaciji nema mesta, vec ti preostaje da porucis kako RDBMS radi neke stvari pa implementiras takve tehnike u svoju aplikaciju.

To i dalje ne znaci da je RDBMS inferioran, nego da ti radis aplikaciju koja po svojoj sustini ne moze da koristi RDBMS.

jablan 16. 02. 2006. 12:46

Citat:

Originalno napisao bojan_bozovic
da RDBMS ne moze da vrsi binarnu pretragu po primarnim kljucevima

A... ovaj... odakle ti to da RDBMS-ovi uopšte koriste binarnu pretragu da bi došli do podatka?

Dejan Topalovic 16. 02. 2006. 13:44

@bojan bozovic: Da je Flat DB brza, sigurnija i konzistentnija od nekog RDBMS-a (Oracle, MySQL, MS SQL, IBM DB2, PostgreSQL i td.), zar ne mislis da bi taj princip vec neko razradio i na njemu zgrnuo lovu? Sve to sto pricas - jednostavno ne pije vodu.

Jos se nisam u zivotu susreo sa situacijom u kojoj bi mi umjesto nekog RDBMS-a bolje bilo koristiti flat-text file za cuvanje podataka...

ivanhoe 16. 02. 2006. 15:14

sta zoves binarnom pretragom? Vecina baza koristi B stabla, ali to nema nikakve veze sa binarnim pretrazivanjem...mozda te samo nisam dobro shvatio, ajde pojasni malo sta si tacno mislio?

Takodje unosi u B stablima se obicno ne brisu stalno, nego se samo markiraju kao obrisani, pa se onda sa vremena na vreme uradi brisanje i balansiranje celog stabla...AFAIK...mada posto mi nije jasno sta si hteo da kazes, ne znam da li to ima ikakve veze sa ovim sto ti kazes :)

@Dejan: nerelacione baze kao sto je DBM jesu znatno brze od relacionih baza, mada mislim da nije ovo sto Bojan kaze u pitanju, nego su naprosto jednostavnije (imaju samo jedan kljuc i prakticno ni jednu drugu naprednu funkciju baze osim podrske za konkurentne upise)..

bojan_bozovic 16. 02. 2006. 17:06

B-tree je upravo metod sa smestanje podataka u sortiranom obliku, da bi mogla da se koristi binarna pretraga (Hint: http://www.semaphorecorp.com/btp/algo.html http://en.wikipedia.org/wiki/Binary_search) Jednostavno baza izsortira sve i smesti u B-tree prilikom svakog UPDATE querija (i ako je transaction-safe pise na disk) sto moze da se oduzi. Primer su MyISAM i InnoDB tabele u MySQL i koliko brze ide kad ne mora da se obezbede transakcije, snapshoti, strani kljucevi i sve ostalo (hint - bez provere da li postoji vec kljuc vec dobijas na brzini) Samo u jedan niz izsortiraj podatke i imas rudimentaran B-tree koji dalje mozes da prosirujes :)

@jablan

Ne nego koriste brute-force pretragu :) Vidis da je koriste. Mora, to je teorijski najbolje.

@pedja

Nisam mislio da se nista budzi. Dakle, podaci bi opet bili izsortirani za binarnu pretragu (B-tree), ali bez snapshotova, transakcija, logovanja querija na disk i sl (cak i query ne bi morao da bude SQL query - otpada SQL parser)

jablan 16. 02. 2006. 17:28

B stabla nemaju puno veze sa binarnim pretraživanjem - kad imaš B stablo nemaš potrebe za pretraživanjem, već samo prolazak kroz već sortirano stablo. tačno je da se onda produžava insert i update, ali je to cena koju plaćaš za brži select. ta cena bi bila još veća da podatke držiš sortirane negde sekvencijalno. Ne razumem baš tvoju poentu.

bojan_bozovic 16. 02. 2006. 17:31

Binarna pretraga nije sortiranje. Dovoljno je da imas sledeci b-tree
Kôd:

[a-m]                  [n-z]
!  ......................    !
bojan - jablan        pedja

i trazis pedja. da li je p<=m ili nije (binarna pretraga :))

Prakticno, zasto imamo nesto kao MySQL koji podrzava mnogo onoga sto nam te treba (sa DBM prve generacije nisam radio, ali bi mozda tu trebao da bude start neke web baze, ne znam)

@Dejan Topalovic

Perl ili PHP su suvise spori. Dobro je samo ako imas vrlo malo podataka. Moralo bi ovo o cemu pricam da se implemetira u kompajliranom jeziku - bas kao neki RDBMS


Vreme je GMT +2. Trenutno vreme je 01:07.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.