|
Regular expression i htaccess regex, PCRE, POSIX, upotreba Apache .htaccess , mod_rewrite |
|
Alati teme | Način prikaza |
|
22. 08. 2011. | #1 |
Psychedelictrance freak
Wrote a book
|
PHP: Kako da uhvatim sve varijacije http-equiv="refresh" i izvucem URL
Kao sto pise u naslovu ... hvala Slicna tema ima ovde: http://stackoverflow.com/questions/1...fresh-meta-tag, ali mi se cini da resenja nisu najbolja.
__________________
Testiranje bezbednosti web aplikacija |
22. 08. 2011. | #2 |
expert
Grand Master
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
|
Probaj...
http://codepad.org/0zlzTmUH PHP kôd:
|
"Hvala" webarto za poruku: |
22. 08. 2011. | #3 |
Super Moderator
Invented the damn thing
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
|
Nesto ovako:
PHP kôd:
|
"Hvala" dinke za poruku: |
22. 08. 2011. | #4 |
expert
Grand Master
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
|
Opet mislim da ćeš ovako najprije ubosti sa RegEx...
PHP kôd:
Poslednja izmena od webarto : 22. 08. 2011. u 15:47. |
"Hvala" webarto za poruku: |
22. 08. 2011. | #5 | |
Super Moderator
Invented the damn thing
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
|
Citat:
Inace slazem se za case (/i) ali ne i za multiline modifier posto \s u mom slucaju hvata i \n. Da sam koristio negde dot (.) trebao bi /s. Inace kad smo kod modifiera za utf dokumente treba dodati i u. |
|
"Hvala" dinke za poruku: |
22. 08. 2011. | #6 |
Super Moderator
Invented the damn thing
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
|
^Btw upravo testirao svoj primer na svojoj makini, regexp radi (ipak su to godine iskustva u site scrappingu haha). Naravno treba dodati /i za case insensitive search eventualno /u za unicode.
|
"Hvala" dinke za poruku: |
22. 08. 2011. | #7 |
expert
Grand Master
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
|
Da, vidi se da si iskusan sa ' " I ovako nešto je validno, po meni opet najbolje pucati na url=, ne bi trebalo da ni jedan drugi element sadrži slično, a svejedno ovaj preg_match će da dohvati samo prvi
Kôd:
<META CONTENT='0; url=www.google.com" http-equiv=refresh /> Poslednja izmena od webarto : 22. 08. 2011. u 18:49. |
22. 08. 2011. | #8 |
Super Moderator
Invented the damn thing
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
|
^Realno ja sam pokupio primere sa http://en.wikipedia.org/wiki/Meta_refresh i testirao na osnovu toga, za siri spektar funkcionalnosti treba imati u vidu mnogo toga, npr da url deo moze u potpunosti nedostajati (u tom slucaju mislim da ucitava ponovo istu stranu) itd.
Tvoj primer nije dobar posto moze da pokupi url sa bilo kog dela strane. Ja iskreno nisam video nigde da neko content deo stavlja pre http-equiv, nemam pojma da li je regularno, ali okay ako zakeras mozemo onda i ovako PHP kôd:
|
22. 08. 2011. | #9 |
expert
Grand Master
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
|
Validan je HTML ali mislim da će se tako nešto javiti u 1 od 100
I ja skoro sve radim sa RegEx, ali u ovom slučaju gdje ima previše varijacija, mislim da je bolje koristiti DOM parser, čak i ovu "zakeranu" verziju pogodi bez izmjene, da ne kažem da je lakše nego pisati RegEx Neće pokupiti sa bilo kojeg dijela, već prvi na koji naleti, a u suštini samo jedan bi trebao i biti... sve je moguće http://codepad.org/tbcKu5qB |
22. 08. 2011. | #10 |
Super Moderator
Invented the damn thing
Datum učlanjenja: 06.06.2005
Poruke: 2.371
Hvala: 370
701 "Hvala" u 194 poruka
|
Sto se DOM Parsera tice, svojevremeno kada sam radio na parseru za Blogodak ja sam za filtriranje feed-ova pokusao da koristim XML parsere ali sam imao uzasne probleme svog svakojakog html djubreta koje se moglo naci u validnim xml feed-ovima. Mislim da sam koristio expat a ne DOM (event based parser) ali to je bilo davno
Uglavnom, sto se xml-a tice, drzim se @ivanhoe krilatice - najbolji nacin da se parsira xml je da se pravis da uopste nije xml |
|
|