DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   SQL baze podataka - Sponzor: Baze-Podataka.net (http://www.devprotalk.com/forumdisplay.php?f=10)
-   -   Korišćenje ćirilice u MySQL bazi? (http://www.devprotalk.com/showthread.php?t=7758)

Miroslav 11. 08. 2009. 00:01

Korišćenje ćirilice u MySQL bazi?
 
Koliko ćirilica zauzima više prostora u bazi od latinice?

Da li ne neki način može da uspori korišćenje baze (da li je pretraga možda sporija)?

Naime, imam mnogo tekstova koji moraju da budu ćirilični ali ne znam koliko je pametno da ih sve čuvam u bazi u ćiriličnom pismu.
Ja bi ih sve preveo u latinicu pri upisivanju, a pri čitanju bi ih vratio u ćirilicu ali ne mogu jer se pojavljuju i neke strane reči (na ruskom).

mileusna 11. 08. 2009. 00:38

Praktičnije je držati tekstove u ćirilici u bazi i preslovljavati ih na latinicu prilikom prikaza nego obrnuto, ako već imaš materijal na ćirilici.

Ako recimo imaš u bazi "Facebook је купио FriendFeed" onda će prilikom preslovljavanja na latinicu rečenica glasiti "Facebook je kupio FirendFeed". Sa druge strane, ako imaš latiničnu verziju u bazi i presloviš je na ćirilicu dobićeš "Фацебоок је купио ФриендФеед".

Što se tehničkog aspekta tiče, ne verujem da će ti ćirilica praviti neke probleme. Kada kažeš "mnogo" tekstova koliko je to mnogo? Kada kažeš "pretraga" na šta konkretno misliš, postoji više načina da se baza pretraži. :)

Miroslav 11. 08. 2009. 13:31

Da. Iz tvog primera se jasno vidi da je ćirilica dosta praktičnija za čuvanje u bazi u ovom mom slučaju.

Nego ako sam dobro razumeo, ćirilični karakteri su "multibyte" karakteri, pa sam zato zaključio da će zauzimati više mesta u bazi. Recimo ako neki tekst na ćirilici zauzima 50 kb na latinici može da zauzme 25 kb? Možda grešim s obzirom da se ne razumem baš najbolje u baze...

sinisabobic 11. 08. 2009. 16:33

Sve zavisi na koji način to čuvaš u bazi. Pošto pretpostavljam da ćeš odabrati UTF-8 koji je ASCII kompatibilan encoding onda će svi ASCII karakteri (a, b, c, d, ...) zauzimati 1 bajt dok će ostali zauzimati 2 bajta (š, ш, đ, ђ, ...).

robi-bobi 11. 08. 2009. 16:40

osim ako bas nemas neki doooobar razlog za suprotno, moj savet je da ovo ne razmatras kao problem

cirilica vs latinica razmatraj sa svih drugih aspekata osim ovog :)

razlika u velicini nije toliko bitna
rad sa cirilicom je lagan (mysql radi lepo str operacije, a uz (po zelji ) podesen php - mozes koristiti i 'obicne' PHP funkcije za rad sa stringovima)

dinke 11. 08. 2009. 17:36

The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

http://www.joelonsoftware.com/articles/Unicode.html

(po ko zna koji put ali dobro)

akubra 13. 08. 2009. 12:50

Тхе Трутх оф Оур Фаитх:

http://www.manastir-lepavina.org/vijest_cir.php?id=3555

(originalni tekst: http://www.manastir-lepavina.org/vijest.php?id=3555 )


Naravoučenije, bolje izbegavati pretvaranje ćirilice u latinicu i slične egzibicije, ukoliko nisi potpuno siguran da znaš šta radiš i da ti je to neophodno.

nn.nn 13. 08. 2009. 13:04

^ Transliteracija ćirilice u latinicu je trivijalna stvar, a ovi primeri koje si naveo odnose se na obrnut smer.

Miroslav 13. 08. 2009. 13:26

Citat:

Originalno napisao sinisabobic (Napišite 72144)
Sve zavisi na koji način to čuvaš u bazi. Pošto pretpostavljam da ćeš odabrati UTF-8 koji je ASCII kompatibilan encoding onda će svi ASCII karakteri (a, b, c, d, ...) zauzimati 1 bajt dok će ostali zauzimati 2 bajta (š, ш, đ, ђ, ...).

Odabrao sam:
Kôd:

DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci


Vreme je GMT +2. Trenutno vreme je 18:37.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.