DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   SQL baze podataka - Sponzor: Baze-Podataka.net (http://www.devprotalk.com/forumdisplay.php?f=10)
-   -   MySQL nepravi razliku izmedju č, ć i c (http://www.devprotalk.com/showthread.php?t=11343)

357_97 21. 12. 2012. 22:08

MySQL nepravi razliku izmedju č, ć i c
 
Imam bazu koja je utf8, tabelu
Kôd:

CREATE TABLE a_test (
        naziv VARCHAR(50) CHARACTER SET utf8 COLLATE utf8_unicode_ci
) ENGINE=INNODB DEFAULT CHARSET=utf8;

podatke u tabeli
Kôd:

INSERT INTO a_test (naziv) VALUES ('Čačak') , ('Ćirko') , ('Čovek') , ('Car') , ('Čarna');
i upit
Kôd:

SELECT * FROM a_test
WHERE naziv LIKE 'Ć%';

koji vraca
Kôd:

Čačak
Ćirko
Čovek
Car
Čarna

Je l moguće i kako naterati MySQL da vrati samo nazive koji počinju samo sa ć, nebitno je da li je malo ili veliko slovo u pitanju?

ivanhoe 21. 12. 2012. 22:42

To ima veze sa collation-om, ima ovde objasnjenje http://dev.mysql.com/doc/refman/5.0/...entations.html

ali ne znam koje je resenje sem da stavis neki ascii za to polje...

357_97 22. 12. 2012. 00:14

Ako sam ja dobro razumeo sta pise link-1 i link-2 izgleda da to nije moguce!

link-1:
For example, the following equalities hold in both utf8_general_ci and utf8_unicode_ci:

Ä = A
Ö = O
Ü = U

link-2:
Non-UCA collations have a one-to-one mapping from character code to weight. In MySQL, such collations are case insensitive and accent insensitive. utf8_general_ci is an example: 'a', 'A', '脌', and '谩' each have different character codes but all have a weight of 0x0041 and compare as equal.

Ono sto mene zbunjuje je sto ovo sve radi kako treba ako se postavi konekcija latin1, a tabela definise kao
Kôd:

SET NAMES 'latin1';

CREATE TABLE a_test_latin (
        naziv VARCHAR(50) CHARACTER SET latin1 COLLATE latin1_general_ci
) ENGINE=INNODB DEFAULT CHARSET=latin1;

INSERT INTO a_test_latin (naziv) VALUES ('Čačak') , ('Ćirko') , ('Čovek') , ('Car') , ('Čarna');

SELECT * FROM a_test_latin
WHERE naziv LIKE 'Č%'  COLLATE latin1_general_ci;

naziv
Čačak
Čovek
Čarna

Ovako je trenutno na produkciji i poredjenje radi ali je problem sto je kroz konekciju latin1 guran utf8, pojedine kolone su definisane kao ut8, pa se za te kolone u bazi vidi 'djubre'. Nikako da nadjem resenje kako da eliminisem istovremeno oba problema i poredjenje i 'djubre' u bazi!

pkrstic 22. 12. 2012. 03:15

Resenje je da stavis collation utf_slovenian_ci, ja sam isti problem imao pre neki dan, default collation je utf8_general_ci, koji sva slova svodi na njihove proste varijante, tj č i ć u c, š u s, ž u z, dok đ radi valjda zato sto isti karakter postoji u islandskom pismu.

Po mysql dokumentaciji je dovoljno staviti utf8_unicode_ci, ali u mom slučaju to nije pomoglo.

utf8_general_ci je brzi, manje precizan jer ne podrzava sva nasa i gomilu drugih slova tako sto ih cuva u indexu kao jednostavnije varijante iz ascii skupa

utf8_unicode_ci je sporiji, ali precizniji jer radi sa akcentovanim slovima, tj u tvom slučaju sa našim slovima.

webarto 22. 12. 2012. 04:00

...
Kôd:

LIKE BINARY 'Č%'
http://sqlfiddle.com/#!2/8f46d/1/1

357_97 22. 12. 2012. 12:38

Samo da zahvalim @pkrstic-u i @webart-u na predlozima. Problem je resen! :1042:
Citat:

Originalno napisao pkrstic (Napišite 109512)
utf8_general_ci je brzi, manje precizan jer ne podrzava sva nasa i gomilu drugih slova tako sto ih cuva u indexu kao jednostavnije varijante iz ascii skupa

utf8_unicode_ci je sporiji, ali precizniji jer radi sa akcentovanim slovima, tj u tvom slučaju sa našim slovima.

Ovo sam i ja saznao dok sam trazio resenje za problem. Na jednom site-u su cak eksplicitno preporucili utf8_unicode_ci za srpski.

ivanhoe 22. 12. 2012. 12:49

utf8_unicode_ci je bitan i zbog pravilnog sortiranja, narocito cirilice


Vreme je GMT +2. Trenutno vreme je 16:18.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.