DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   PHP (http://www.devprotalk.com/forumdisplay.php?f=9)
-   -   iconv (http://www.devprotalk.com/showthread.php?t=1104)

zoki 08. 06. 2006. 19:26

iconv
 
Pošto hoću da kreiram nice and clean URLs od naslova koji se čupaju iz baze u UTF-8 formatu, potrebno je da te naslove konvertujem u ISO-8859-1 kako bi se prikazao u URL-u lepo.

koristim nešto ovako

$string = iconv("UTF-8", "ISO-8859-1//TRANSLIT", $string);

ovo //TRANSLIT piše u manualu da će se karakter prevesti u najsličniji njemu ako ne može tačno baš.


međutim neće lepo da radi, npr kreira mi od naslova koji glasi

Riverpsyde (Tiszapüspöki) and Protoneon.hu

kreira URL:

http://kalendar.psygarden.org/event/...nd-protoneonhu

encoding stranice je UTF-8.

http://kalendar.psygarden.org

ivanhoe 08. 06. 2006. 21:11

nisam to nikad koristio, ali mozes da probas sa ovim kodom (mada ni njega nisam koristio :) ):

PHP kôd:

$str_iso8859_1 preg_replace"/([\xC2\xC3])([\x80-\xBF])/e"
    
"chr(ord('\\1')<<6&0xC0|ord('\\2')&0x3F)",
    
$str_utf8); 


cvele 09. 06. 2006. 10:52

Pomoglo bi kada bi rekao sta dobijas bez //TRANSLIT mrzi me da testiram sada.
U sustini jedini trenutak kada sam imao problem sa ovom konverzijom jeste kada sam morao da prevedem m$ office karaktere. (produzeni minus) To sam resio tako sto sam radio str_replace. Ako je to i tvoj problem jednostavno zameni produzeni minus (cini mi se da je 0x96 mada nisam siguran) sa obicnim minusom, isto mozes da uradis sa svim ostalim karakterima koji ti prave problem, sigurno ih nema mnogo.

Sto se //TRANSLIT tice on ce ti retko pomoci u onome sto zelis da postignes. On je zaista zamenio sa slicnim karakterima, ali problem je u tome sto ni ti karakteri nisu url firendly.

I jos kao dodatak evo kako sam ja resavao problem url-ova.

PHP kôd:

function keyword_url ($string) {

    
$keyword_array explode(" "strtolower($string));
        
    for (
$j=0$j<count($keyword_array); $j++)
    {
    
$patterns = array(
    
";""@""?"":""=""&",
    
"<"">"'"'"#""[""]",
    
"%""{""}""|""^""~",
    
"/""\\""`""$""-""'"" - ",
    
"´""("")""."",""*""-""--",
    
" ;"" @"" ?"":""=""&",
    
" < "" > "' " '" # "" [ "" ] ",
    
" % "" { "" } "" | "" ^ "" ~ ",
    
" / "" \\ "" ` "" $ "" - "" ' "
    
"´ "" ( "" ) "" . "" , "" * ",
    
" - "" -- "," "
    
);
    
$replacements "";
    
$keyword_array[$j] = str_replace($patterns$replacements$keyword_array[$j]);
    }
    
$keyword_array array_unique($keyword_array);
    
//common
    
$replacements "";
    
$no count($keyword_array);
    for (
$i=0$i<$no$i++) {
        if (
strlen($keyword_array[$i])>2) {
        
$keyword_array1[$z] = $keyword_array[$i];
        
$z++;
        }
    }
    
$keyword_string implode("-"$keyword_array1);
    
$keyword_array str_replace("--""-"$keyword_string);
    
    return 
$keyword_array;


i razne varijacije na istu temu...

MorenoArdohain 09. 06. 2006. 11:06

Cvele, nije ti bas dobra funkcija, posto ne barata sa Unicode karakterima

Evo sta bi on dobio:
riverpsyde-tiszapüspöki-and-protoneonhu

A inace, tvoja funkcija je mogla i krace, sve nestandardne karaktere pretvara u -
$url=stripslashes($string);
$url=preg_replace('|\'|', '', $url);
$url=preg_replace('|[^a-z0-9]|i', '-', $url);
$url=preg_replace('|--+|i', '-', $url);
$url=preg_replace('|^-|i', '', $url);
$url=preg_replace('|-$|i', '', $url);

Edit: tek sad skontah da Cvele nije ni rekao da to radi sa Unicode LOL, sorry :)

cvele 09. 06. 2006. 13:38

znam da je mogla i krace ali posto sam duduk za regexp (a mrzi me da nesto radim povodom toga) to izgleda tako kako izgleda :)

zoki 09. 06. 2006. 16:22

rešio sam, tj promašio sam bio out encoding... mada sad kad naiđe na Unicode character, ignoriše ga, tj samo ga izbacuje. Bolje i to nego da stavlja Unicode.

evo celokupne funkcije za clean url:

PHP kôd:

    $string iconv("UTF-8""ISO-8859-5//TRANSLIT"$string);

         
$string strtolower($string);
    
$string preg_replace("/[ ]/""-"$string);
    
$string preg_replace("/[.,:;\/!?\"\'\\<>@#$%^&*()_+=]/"""$string);
    
$string preg_replace("/(-){2,}/""-"$string);
    
$string preg_replace("/(-)+$/"""$string);
    
$string preg_replace("/^(-)+/"""$string);

    return 
$string

sve spacove pretvara u crtice, onda sve one specijalne karaktere "seče", uklanja crtice sa početka ili kraja, i ako ima 2 ili više crtice, pretvara ih u jednu.


Vreme je GMT +2. Trenutno vreme je 13:46.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.