Pogledajte određenu poruku
Staro 09. 03. 2007.   #1
dinke
Super Moderator
Invented the damn thing
 
Avatar dinke
 
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
dinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamendinke je pravi dragi kamen
Default Filtriranje nezeljenih atributa u html-u

Imam problem sa filtriranjem html elemenata koje dobijam iz rss feedova (na blogotku). Da budem precizniji, treba mi nesto poput strip_tags u php-u, ali za html atribute, obzirom da strip_tags uklanja samo nezeljene elemente, pri cemu unutar njih svi atributi ostaju.

Ranije sam za to manje vise uspesno koristio sax parser, ali to vise ne mogu zbog buga u PHP 5.2(na stranu sto je sax cesto pucao zbog lose formiranog xml-a). U prethodna dva dana sam koristio PHP Input Filter klasu, ali sam provalio bug kod nje(uklanja deo querystringa tamo gde postoji), tako da sam ponovo na pocetku.

Ivanhoe mi je na jednom drugom postu preporucio regexp, sto je verovatno i najbolje resenje imajuci sve gore navedeno u vidu, ali imam problem sa formiranjem tog regexp-a koji bi prihvatao samo "pozitivne" elemente (i pritom uklanjao negativne). Znam da mogu da radim obrnuto (tipa, sa preg_match_replace brisem redom style, script i sl. atribute), ali se pitam da li je izvodljivo da uradim suprotno - izvucem samo ono sto mi treba.

I naravno, ako neko ima neko drugo neregexp resenje, otvoren sam za sve sugestije
__________________
Caught in a Web|Blogodak
With great power comes great responsibility!
dinke je offline   Odgovorite uz citat