DevProTalk

Forumi IT profesionalaca
web development, web design, e-business, SEO


Idite nazad   DevProTalk > Web development i web aplikacije > PHP
Želite da se reklamirate ekskluzivno na ovoj poziciji? Javite se

PHP PHP aplikacije, Smarty, PEAR

Odgovori
 
Alati teme Način prikaza
Staro 15. 02. 2011.   #1
Vladimir Rodic
Webeloper
Professional
 
Avatar Vladimir Rodic
 
Datum učlanjenja: 19.10.2006
Lokacija: Novi Sad
Poruke: 348
Hvala: 136
33 "Hvala" u 24 poruka
Vladimir Rodic is on a distinguished road
Pošaljite poruku preko Skype™ za Vladimir Rodic
Default poredjenje dva identicna stringa

imam funkciju koja za zadati string (ime fajla) pretrazuje folder da vidi da li taj fajl u istom postoji.

Problem lezi u tome sto za string (ime fajla) koji postoji u folderu i zadati string, PHP kaze da imena nisu jednaka.

Problem mi pravi jedan umlaut karakter ö. Pokusam sa str_replace da zamenim ö za oe, ali mi zameni samo za jedan string (uneti). Ovaj string koji predstavlja ime fajla u folderu, iscitano pomocu scandir funkcije ima neku drugu vrednost i ne biva zamenjen.

Oba stringa imaju identican enkoding UTF-8, medjutim kad na oba pozovem utf8_encode vraca mi razlicite vrednosti za problematicni karakter. Funkcija html_entities takodje vraca razlicite vrednosti pri konvertovanju.

Jedino mi hexdec vraca istu vrednost za oba stringa ali je ona nepouzdana za poredjenje (ili gresim?).

Ima li neko ideje kako mogu da poredim (ili prvo konvertujem pa poredim) dva stringa drugacije ?
__________________
Before you criticize someone, walk a mile in their shoes.
By the time they get angry you're a mile away and you've got their shoes!
Vladimir Rodic je offline   Odgovorite uz citat
Staro 15. 02. 2011.   #2
webarto
expert
Grand Master
 
Avatar webarto
 
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
webarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished road
Default

http://php.net/manual/en/function.strcmp.php ?

PHP kôd:
$string1 "˙ţýü";
$string2 "˙ţýü";

echo 
strcmp($string$string2); // 0 
0 znači da su identični


Što se tiče hexdec, imaš temu juče otvorena...

Preg_replace by jablan
PHP kôd:
$string "!\"#$%&'()";
 
$hex preg_replace("/(.)/es""sprintf(' %02X', ord(stripslashes('$1')))"$string);
 
echo 
$hex
by me...
PHP kôd:
$string "!\"#$%&'()";

function 
strhex($string){
    for(
$i 0$i strlen($string); $i++){
        
$hex unpack('H*'substr($string$i1));
        
$return .= $hex[1]." ";
    }
return 
$return;
}

echo 
strhex($string); // 21 22 23 24 25 26 27 28 29 
Ova moja funkcija vraća "c3 bc", za umlaut odnosno 252 karakter.

Poslednja izmena od webarto : 15. 02. 2011. u 18:48.
webarto je offline   Odgovorite uz citat
"Hvala" webarto za poruku:
Staro 15. 02. 2011.   #3
jablan
VD IT Direktora
Invented the damn thing
 
Avatar jablan
 
Datum učlanjenja: 08.06.2005
Lokacija: Beograd
Poruke: 2.118
Hvala: 503
1.307 "Hvala" u 282 poruka
jablan je pravi dragi kamenjablan je pravi dragi kamenjablan je pravi dragi kamenjablan je pravi dragi kamenjablan je pravi dragi kamenjablan je pravi dragi kamenjablan je pravi dragi kamenjablan je pravi dragi kamenjablan je pravi dragi kamenjablan je pravi dragi kamen
Default

@Rodic: Otkud znaš da su oba stringa UTF-8? Odradi strlen() na jednom i na drugom da bi bio siguran, pošto po svemu sudeći ti je jedan od njih u nekom 8-bitnom enkodingu. Koji je FS u pitanju, btw?
__________________
blog
jablan je offline   Odgovorite uz citat
"Hvala" jablan za poruku:
Staro 15. 02. 2011.   #4
dinke
Super Moderator
Invented the damn thing
 
Avatar dinke
 
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
dinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamen
Default

Ne znam sta koristis za trazenje stringa, ali imajuci u vidu razlicite encodinge to bi trebala biti neka od mb* f-ja. Dakle probaj npr mb_stripos. Takodje mozes koristiti mbstring/iconv f-je za detekciju encodinga (iconv nije uvek instaliran be aware).
__________________
Caught in a Web|Blogodak
With great power comes great responsibility!
dinke je offline   Odgovorite uz citat
"Hvala" dinke za poruku:
Staro 15. 02. 2011.   #5
Dragi Tata
dinosaurus
Master
 
Avatar Dragi Tata
 
Datum učlanjenja: 29.12.2005
Lokacija: Nova Engleska
Poruke: 636
Hvala: 79
263 "Hvala" u 66 poruka
Dragi Tata će postati "faca" uskoroDragi Tata će postati "faca" uskoroDragi Tata će postati "faca" uskoro
Default

Такође имај на уму да слова као што је ö могу да се енкодују на два начина: нормализовано као један карактер (U+00f6) или денормализовано као два карактера: (o¨). У оба случаја је приказ исти.
Dragi Tata je offline   Odgovorite uz citat
"Hvala" Dragi Tata za poruku:
Staro 16. 02. 2011.   #6
Vladimir Rodic
Webeloper
Professional
 
Avatar Vladimir Rodic
 
Datum učlanjenja: 19.10.2006
Lokacija: Novi Sad
Poruke: 348
Hvala: 136
33 "Hvala" u 24 poruka
Vladimir Rodic is on a distinguished road
Pošaljite poruku preko Skype™ za Vladimir Rodic
Default

Citat:
Originalno napisao jablan Pogledajte poruku
@Rodic: Otkud znaš da su oba stringa UTF-8?
mb_detect_encoding, vraca mi za oba UTF-8, medjutim kad odradim utf8_encode na ta dva stringa za prvi Ö mi vrati Ă– a za drugi Ö (koji pravi problem) OĚˆ

Citat:
Originalno napisao jablan Pogledajte poruku
Odradi strlen() na jednom i na drugom da bi bio siguran, pošto po svemu sudeći ti je jedan od njih u nekom 8-bitnom enkodingu. Koji je FS u pitanju, btw?
odradio strlen i u pravu si daju mi razlicitu vrednost. Ovaj umlaut koji mi pravi problem je snimljen kao dva karaktera (sto je Dragi Tata rekao), ovaj normalan koji sam ja ukucao, kao jedan.

E sad pitanje kako da pretrazim, tj uporedim ta dva stringa, kad smo utvrdili da je jedan snimljen normalizovano kao jedan karakter a drugi kao dva ?

Napomena: trebalo bi da vrsim zamenu umlauta pre uporedjivanja za normalna slova, ö postaje ou, ali ne znam kako da ukucam ovo ö koje se sastoji od dva karaktera, tako da ga funkcija str_replace pronadje i zameni ? (pokusao sam sa o¨ ali nije funkcionisalo)
__________________
Before you criticize someone, walk a mile in their shoes.
By the time they get angry you're a mile away and you've got their shoes!

Poslednja izmena od Vladimir Rodic : 16. 02. 2011. u 12:22. Razlog: sir i krompir
Vladimir Rodic je offline   Odgovorite uz citat
Staro 16. 02. 2011.   #7
webarto
expert
Grand Master
 
Avatar webarto
 
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
webarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished road
Default

Je li mora biti "ou"?

PHP kôd:
$string 'rené';
$string iconv('UTF-8''ASCII//TRANSLIT'$string);
echo 
$string// outputs rene 
webarto je offline   Odgovorite uz citat
Staro 16. 02. 2011.   #8
MorenoArdohain
Knowledge base
Wrote a book
 
Avatar MorenoArdohain
 
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
MorenoArdohain će postati "faca" uskoroMorenoArdohain će postati "faca" uskoro
Default

Sudeci po ovome: http://www.utf8-chartable.de/ taj znak je c3 b6 u hex formatu. Mozes onda probati sa preg_replace("/\xc3\xb6/", "o", $str); ili nesto slicno (nisam testirao).

Doduse, ne vidim poentu da te karaktere menjas rucno, trebalo bi ti neko globalno resenje za poredjenja.
__________________
Năo quero mais seguir um só caminho
MorenoArdohain je offline   Odgovorite uz citat
Staro 16. 02. 2011.   #9
Vladimir Rodic
Webeloper
Professional
 
Avatar Vladimir Rodic
 
Datum učlanjenja: 19.10.2006
Lokacija: Novi Sad
Poruke: 348
Hvala: 136
33 "Hvala" u 24 poruka
Vladimir Rodic is on a distinguished road
Pošaljite poruku preko Skype™ za Vladimir Rodic
Default

Citat:
Originalno napisao MorenoArdohain Pogledajte poruku
Sudeci po ovome: http://www.utf8-chartable.de/ taj znak je c3 b6 u hex formatu. Mozes onda probati sa preg_replace("/\xc3\xb6/", "o", $str); ili nesto slicno (nisam testirao).

Doduse, ne vidim poentu da te karaktere menjas rucno, trebalo bi ti neko globalno resenje za poredjenja.
Karakteri se menjaju rucno jer mi treba kao takvi da se pamte u bazu, bez umaluta i SPACEa.

Sad cu da probam ovo iznad sto ste napisali obojica.
__________________
Before you criticize someone, walk a mile in their shoes.
By the time they get angry you're a mile away and you've got their shoes!
Vladimir Rodic je offline   Odgovorite uz citat
Staro 16. 02. 2011.   #10
MorenoArdohain
Knowledge base
Wrote a book
 
Avatar MorenoArdohain
 
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
MorenoArdohain će postati "faca" uskoroMorenoArdohain će postati "faca" uskoro
Default

Citat:
Originalno napisao Vladimir Rodic Pogledajte poruku
Karakteri se menjaju rucno jer mi treba kao takvi da se pamte u bazu, bez umaluta i SPACEa.
Mislio sam na to da ne menjas svaki "nepropisni" karakter redom, vec da se upotrebi globalno resenje koje radi za sve karaktere, kakvi god oni bili (kao sto je webartovo resenje). U svakom slucaju, probaj, pa da vidimo sta radi.
__________________
Năo quero mais seguir um só caminho
MorenoArdohain je offline   Odgovorite uz citat
Odgovori


Alati teme
Način prikaza

Pravila pisanja
Možete ne započinjati nove teme
Možete ne slati odgovore
Možete ne slati priloge
Možete ne izmeniti svoje poruke
vB kôd je Uključen
Smajliji su Uključen
[IMG] kod je Uključen
HTML kôd je Isključen
Pogledajte forum


Vreme je GMT +2. Trenutno vreme je 00:08.


Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.
Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.