Citat:
Originalno napisao jablan
@Rodic: Otkud znaš da su oba stringa UTF-8?
|
mb_detect_encoding, vraca mi za oba UTF-8, medjutim kad odradim utf8_encode na ta dva stringa za prvi Ö mi vrati Ö a za drugi Ö (koji pravi problem) Ö
Citat:
Originalno napisao jablan
Odradi strlen() na jednom i na drugom da bi bio siguran, pošto po svemu sudeći ti je jedan od njih u nekom 8-bitnom enkodingu. Koji je FS u pitanju, btw?
|
odradio strlen i u pravu si daju mi razlicitu vrednost. Ovaj umlaut koji mi pravi problem je snimljen kao dva karaktera (sto je Dragi Tata rekao), ovaj normalan koji sam ja ukucao, kao jedan.
E sad pitanje kako da pretrazim, tj uporedim ta dva stringa, kad smo utvrdili da je jedan snimljen normalizovano kao jedan karakter a drugi kao dva ?
Napomena: trebalo bi da vrsim zamenu umlauta pre uporedjivanja za normalna slova, ö postaje ou, ali ne znam kako da ukucam ovo ö koje se sastoji od dva karaktera, tako da ga funkcija str_replace pronadje i zameni ? (pokusao sam sa o¨ ali nije funkcionisalo)