DevProTalk

Forumi IT profesionalaca
web development, web design, e-business, SEO


Idite nazad   DevProTalk > Web development i web aplikacije > Regular expression i htaccess
Želite da se reklamirate ekskluzivno na ovoj poziciji? Javite se

Regular expression i htaccess regex, PCRE, POSIX, upotreba Apache .htaccess , mod_rewrite

Odgovori
 
Alati teme Način prikaza
Staro 06. 03. 2007.   #1
Ilija Studen
Direktor Kombinata
Invented the damn thing
 
Avatar Ilija Studen
 
Datum učlanjenja: 07.06.2005
Poruke: 2.669
Hvala: 44
119 "Hvala" u 64 poruka
Ilija Studen će postati "faca" uskoroIlija Studen će postati "faca" uskoro
Default URL-ovi iz teksta...

Imam funkciju koja mi vraća URL-ove iz teksta. Problem je što vraća sve na šta naleti, a da odgovara formatu URL-a. To je ranije bilo očekivao ponašanje, međutim, sada mi treba da izvlači URL-ove samo unutar href atributa linka.

Ima neko nešto gotovo ili savet kako ovo da napravim?
Ilija Studen je offline   Odgovorite uz citat
Staro 06. 03. 2007.   #2
Petar Marić
Python Ambassador
Master
 
Avatar Petar Marić
 
Datum učlanjenja: 06.06.2005
Lokacija: Novi Sad
Poruke: 602
Hvala: 28
27 "Hvala" u 17 poruka
Petar Marić će postati "faca" uskoro
Pošaljite ICQ poruku za Petar Marić
Default

Ako je pitanju PHP - DOM radi posao.
__________________
Python Ambassador of Serbia
Petar Marić je offline   Odgovorite uz citat
Staro 07. 03. 2007.   #3
ivanhoe
Ivan Dilber
Sir Write-a-Lot
 
Avatar ivanhoe
 
Datum učlanjenja: 18.10.2005
Lokacija: Bgd
Poruke: 5.320
Hvala: 104
2.344 "Hvala" u 583 poruka
ivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svima
Pošaljite poruku preko Skype™ za ivanhoe
Default

DOM je spor i trosi memoriju, regexp je majka za ovakve stvari:
PHP kôd:
preg_match_all('|<a[^>]+href\s*=\s*"http://([^"]+)"|i'$html$urls1);
preg_match_all("|<a[^>]+href\s*=\s*'http://([^']+)'|i"$html$urls2);
preg_match_all('|<a[^>]+href\s*=\s*http://([^ ]+)\s|i'$html$urls3);
$all_urls array_merge($urls1[1], $urls2[1], $urls3[1]); 
ova 3 regexpa su tu da pokriju sva 3 moguca slucaja za formatiranje linkova, izbaci one koji ti ne trebaju. Mozda bi ovo sve moglo da se napise i kao jedan regexp, ali me mrzelo da mozgam mnogo
__________________
Leadership is the art of getting people to want to do what you know must be done.
ivanhoe je offline   Odgovorite uz citat
Staro 07. 03. 2007.   #4
Croll
član
Certified
 
Datum učlanjenja: 01.09.2006
Lokacija: Temerin
Poruke: 51
Hvala: 7
7 "Hvala" u 7 poruka
Croll is on a distinguished road
Pošaljite poruku preko Skype™ za Croll
Default

Probaj ovu varijantu, meni lepo radi za zamenu linkova i skidanje atributa u HREF-u:

preg_replace("/<a[\s]+[^>]*href[\s]?=[\s\"\']+(.*?)[\"\']+.*?>([^<]+|.*?)?<\/a>/i", "<a href=\"\\1\">\\2</a>", $text)
Croll je offline   Odgovorite uz citat
Staro 07. 03. 2007.   #5
akubra
član
Certified
 
Avatar akubra
 
Datum učlanjenja: 17.10.2006
Poruke: 65
Hvala: 42
18 "Hvala" u 9 poruka
akubra is on a distinguished road
Default

Evo jedan regexp koji bi trebao da radi sasvim ok:

PHP kôd:
preg_match_all('~<a\s+[^>]*href\s*=\s*["\']*([^"\'\s>]+)~i'$html$urls);
print_r($urls[1]); 
akubra je offline   Odgovorite uz citat
Staro 08. 03. 2007.   #6
ivanhoe
Ivan Dilber
Sir Write-a-Lot
 
Avatar ivanhoe
 
Datum učlanjenja: 18.10.2005
Lokacija: Bgd
Poruke: 5.320
Hvala: 104
2.344 "Hvala" u 583 poruka
ivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svimaivanhoe je ime poznato svima
Pošaljite poruku preko Skype™ za ivanhoe
Default

da ovi ce raditi sa obicnim urlovima, ali ako ima javascripta u urlovima onda nastaje problem, jer moze da se pojavi apostrof unutar navodnika, i obrnuto... mada opet, da ne cepidlacim...
__________________
Leadership is the art of getting people to want to do what you know must be done.
ivanhoe je offline   Odgovorite uz citat
Odgovori



Pravila pisanja
Možete ne započinjati nove teme
Možete ne slati odgovore
Možete ne slati priloge
Možete ne izmeniti svoje poruke
vB kôd je Uključen
Smajliji su Uključen
[IMG] kod je Uključen
HTML kôd je Isključen
Pogledajte forum

Slične teme
Tema Početna poruka teme Forum Odgovori Poslednja poruka
H1 bez teksta, samo img...? Milos Vukotic Marketing i SEO 2 10. 03. 2009. 11:36
IE6 i ponavljanje teksta Milos Vukotic (X)HTML, JavaScript, DHTML, XML, CSS 0 03. 03. 2009. 12:56
Počeo sam da blogujem, evo prvog teksta istok Marketing i SEO 19 24. 03. 2007. 21:30
Izvlačenje teksta iz PDF-a? Ilija Studen PHP 4 13. 09. 2006. 12:16
Prelamanje teksta u formi oliver78 PHP 3 14. 10. 2005. 01:16


Vreme je GMT +2. Trenutno vreme je 01:24.


Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.
Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.