DevProTalk

Forumi IT profesionalaca
web development, web design, e-business, SEO


Idite nazad   DevProTalk > Web development i web aplikacije > Regular expression i htaccess
Želite da se reklamirate ekskluzivno na ovoj poziciji? Javite se

Regular expression i htaccess regex, PCRE, POSIX, upotreba Apache .htaccess , mod_rewrite

Odgovori
 
Alati teme Način prikaza
Staro 24. 08. 2011.   #11
srdjevic
profesionalac
Professional
 
Datum učlanjenja: 15.06.2005
Lokacija: Chicago IL, USA
Poruke: 209
Hvala: 12
12 "Hvala" u 11 poruka
srdjevic is on a distinguished road
Default

Nazalost, ja ne bih nikako koristio DOM parser. Glavni razlog je ona ubijajuca prva linija koda -- ako je ubacis, sredjujes HTML za obradu, ali ubijas url; host deo nije problem, on i treba da je lowercased, ali path, query, anchor, svi oni mogu da ti puknu, jer ih izvlacis lowercased, a ne u originalu (dakle nisu isti linkovi).
Ako je izbacis, parser ce ti puci u >50% koda, jer se nece snaci sa velikim slovima bas najbolje (a mnogi ih koriste).

Dakle, treba preci na pregove... Kako raspored propertija pravi problem, najlakse je (po meni) odraditi ovo u loop-ovima. Prvo izvucemo sve meta tagove, samo proverimo imaju li equiv, i ako imaju, cupamo content.

Radio sam skoro nesto vrlo slicno (sa drugim tagovima), pa evo ti preradjenog resenja (mozda patterni skripe malo, nisam testirao):

PHP kôd:
$html '<head>
<meta http-equiv="refresh" content="0; url=http://example1.com/">
<meta http-equiv=\'refresh\' content="0; url=http://example2.com/">
<meta http-equiv=refresh content="0; url=http://example3.com/">
</head>'
;

$res = array();
$metapattern '/<meta\s(.[^>]*)>/si';
$httppattern '/\s?http-equiv=[\'"]?refresh[\'"]?/si';
$refpattern1 "/\s?content='\d+\s?;\s?url=([^']*)'/si";
$refpattern2 '/\s?content="\d+\s?;\s?url=([^"]*)"/si';
// get all meta tags
preg_match_all($metapattern$html$metas);
foreach ( 
$metas[1] as $meta ) {
    
// check if it's equiv=refr
    
if ( preg_match($httppattern$meta) ) {
        
// extract url prop
        
if ( preg_match($refpattern1$meta$url) || preg_match($refpattern2$meta$url) ) {
            
$res[] = $url[1];
        }
    }
}

print_r($res); 
Doduse, kontam da bi ovo ipak opet pokrilo samo tih istih 99 od 100 gorepomenutih slucajeva, tako da je kanda svejedno...

__________________
ActiveCampaign - Email marketing made simple.
srdjevic je offline   Odgovorite uz citat
"Hvala" srdjevic za poruku:
Staro 24. 08. 2011.   #12
Br@nkoR
banned
Professional
 
Avatar Br@nkoR
 
Datum učlanjenja: 04.06.2005
Poruke: 371
Hvala: 0
738 "Hvala" u 83 poruka
Br@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoro
Default

PHP kôd:
$html '<html>
  <head>
    <MetA hTTp-eQuIv="REFreSH" CoNtEnT="2;   url=http://www.DevProTalk.com" />
    <meta name="keywords" content="dpt" />
    <meta name="description" content="dpt" />

  </head>
  <body>
   neki sadržaj
  </body>
</html>'
;

libxml_use_internal_errors(true);
$dom = new DOMDocument();
$dom->loadHTML($html);
$xpath = new DOMXPath($dom);

$e $xpath->query("//meta[translate(@http-equiv, 'REFSH', 'refsh') = 'refresh']/@content"); 

$content $e->item(0)->textContent;
$content explode('='$content);
$url trim($content[1]);

echo 
$url
__________________
Don't look at me; I'm lost too.
“If you can't dazzle them with brilliance, baffle them with bul*s**t.”
Br@nkoR je offline   Odgovorite uz citat
"Hvala" Br@nkoR za poruku:
Odgovori


Alati teme
Način prikaza

Pravila pisanja
Možete ne započinjati nove teme
Možete ne slati odgovore
Možete ne slati priloge
Možete ne izmeniti svoje poruke
vB kôd je Uključen
Smajliji su Uključen
[IMG] kod je Uključen
HTML kôd je Isključen
Pogledajte forum


Vreme je GMT +2. Trenutno vreme je 20:43.


Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.
Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.