15. 02. 2011. | #1 |
Webeloper
Professional
|
poredjenje dva identicna stringa
imam funkciju koja za zadati string (ime fajla) pretrazuje folder da vidi da li taj fajl u istom postoji.
Problem lezi u tome sto za string (ime fajla) koji postoji u folderu i zadati string, PHP kaze da imena nisu jednaka. Problem mi pravi jedan umlaut karakter ö. Pokusam sa str_replace da zamenim ö za oe, ali mi zameni samo za jedan string (uneti). Ovaj string koji predstavlja ime fajla u folderu, iscitano pomocu scandir funkcije ima neku drugu vrednost i ne biva zamenjen. Oba stringa imaju identican enkoding UTF-8, medjutim kad na oba pozovem utf8_encode vraca mi razlicite vrednosti za problematicni karakter. Funkcija html_entities takodje vraca razlicite vrednosti pri konvertovanju. Jedino mi hexdec vraca istu vrednost za oba stringa ali je ona nepouzdana za poredjenje (ili gresim?). Ima li neko ideje kako mogu da poredim (ili prvo konvertujem pa poredim) dva stringa drugacije ?
__________________
Before you criticize someone, walk a mile in their shoes. By the time they get angry you're a mile away and you've got their shoes! |
15. 02. 2011. | #2 |
expert
Grand Master
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
|
http://php.net/manual/en/function.strcmp.php ?
PHP kôd:
Što se tiče hexdec, imaš temu juče otvorena... Preg_replace by jablan PHP kôd:
PHP kôd:
Poslednja izmena od webarto : 15. 02. 2011. u 18:48. |
"Hvala" webarto za poruku: |
15. 02. 2011. | #3 |
VD IT Direktora
Invented the damn thing
Datum učlanjenja: 08.06.2005
Lokacija: Beograd
Poruke: 2.118
Hvala: 503
1.307 "Hvala" u 282 poruka
|
@Rodic: Otkud znaš da su oba stringa UTF-8? Odradi strlen() na jednom i na drugom da bi bio siguran, pošto po svemu sudeći ti je jedan od njih u nekom 8-bitnom enkodingu. Koji je FS u pitanju, btw?
__________________
blog |
"Hvala" jablan za poruku: |
15. 02. 2011. | #4 |
Super Moderator
Invented the damn thing
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
|
Ne znam sta koristis za trazenje stringa, ali imajuci u vidu razlicite encodinge to bi trebala biti neka od mb* f-ja. Dakle probaj npr mb_stripos. Takodje mozes koristiti mbstring/iconv f-je za detekciju encodinga (iconv nije uvek instaliran be aware).
|
"Hvala" dinke za poruku: |
15. 02. 2011. | #5 |
dinosaurus
Master
Datum učlanjenja: 29.12.2005
Lokacija: Nova Engleska
Poruke: 636
Hvala: 79
263 "Hvala" u 66 poruka
|
Такође имај на уму да слова као што је ö могу да се енкодују на два начина: нормализовано као један карактер (U+00f6) или денормализовано као два карактера: (o¨). У оба случаја је приказ исти.
|
"Hvala" Dragi Tata za poruku: |
16. 02. 2011. | #6 | |
Webeloper
Professional
|
mb_detect_encoding, vraca mi za oba UTF-8, medjutim kad odradim utf8_encode na ta dva stringa za prvi Ö mi vrati Ă– a za drugi Ö (koji pravi problem) OĚˆ
Citat:
E sad pitanje kako da pretrazim, tj uporedim ta dva stringa, kad smo utvrdili da je jedan snimljen normalizovano kao jedan karakter a drugi kao dva ? Napomena: trebalo bi da vrsim zamenu umlauta pre uporedjivanja za normalna slova, ö postaje ou, ali ne znam kako da ukucam ovo ö koje se sastoji od dva karaktera, tako da ga funkcija str_replace pronadje i zameni ? (pokusao sam sa o¨ ali nije funkcionisalo)
__________________
Before you criticize someone, walk a mile in their shoes. By the time they get angry you're a mile away and you've got their shoes! Poslednja izmena od Vladimir Rodic : 16. 02. 2011. u 12:22. Razlog: sir i krompir |
|
16. 02. 2011. | #7 |
expert
Grand Master
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
|
Je li mora biti "ou"?
PHP kôd:
|
16. 02. 2011. | #8 |
Knowledge base
Wrote a book
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
|
Sudeci po ovome: http://www.utf8-chartable.de/ taj znak je c3 b6 u hex formatu. Mozes onda probati sa preg_replace("/\xc3\xb6/", "o", $str); ili nesto slicno (nisam testirao).
Doduse, ne vidim poentu da te karaktere menjas rucno, trebalo bi ti neko globalno resenje za poredjenja.
__________________
Năo quero mais seguir um só caminho |
16. 02. 2011. | #9 | |
Webeloper
Professional
|
Citat:
Sad cu da probam ovo iznad sto ste napisali obojica.
__________________
Before you criticize someone, walk a mile in their shoes. By the time they get angry you're a mile away and you've got their shoes! |
|
16. 02. 2011. | #10 |
Knowledge base
Wrote a book
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
|
Mislio sam na to da ne menjas svaki "nepropisni" karakter redom, vec da se upotrebi globalno resenje koje radi za sve karaktere, kakvi god oni bili (kao sto je webartovo resenje). U svakom slucaju, probaj, pa da vidimo sta radi.
__________________
Năo quero mais seguir um só caminho |
|
|