DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   Regular expression i htaccess (http://www.devprotalk.com/forumdisplay.php?f=41)
-   -   PHP: Url unutar stringa (http://www.devprotalk.com/showthread.php?t=11122)

Bojsi 23. 07. 2012. 05:41

PHP: Url unutar stringa
 
Pozdrav,

Pokusavam po webu da nadjem neki reg-ex za PHP koji vraca true ukoliko string sadrzi bilo kakav url (sa http i bez, mozda i neki egzoticniji url) osim ako taj url nije unutar URL taga (koji isto radi kao ovaj na forumu).

Jedini problem koji imam sa spamerima je taj gde postuju one dugacke tekstove sa gomilom url-ova. Jako retko se javi neki spamer sa url-om izmedju ta 2 BB URL taga.

Hvala puno.

ivanhoe 23. 07. 2012. 13:41

Tesko ces to izvesti jednim regExpom jer negative look-behind zahteva fixnu sirinu, a [URL ...] tag moze da sadrzi url koji je proizvoljne duzine... a bez look-behind ne mozes da proveris da li je vec u URL-u

Ja bih to radio mnogo jednostavnije u 2 koraka: kopirao text i uradio preg_replace da pocistim sve [URL...]...[/url] blokove iz njega, pa onda jednostavno proverio da li je posle toga ostao jos neki url u textu.

webarto 23. 07. 2012. 13:44

'ajde ti postavi jedan primjer... možda postoji silver bullet, ali što je gluplji regex, to je brži...

ivanhoe 23. 07. 2012. 15:07

@webarto: ne znam kome je bilo upuceno, ali evo primer za ovo sto ja pricam:
PHP kôd:

function has_links($input) {
    
$tlds = array('com','org','net','info','tk'); // itd... mrzi me da kucam
    
$input preg_replace('#\[url(=[^\]]+)?\].+?\[/url\]#i'''$input);
    return 
preg_match('/[a-z0-9]\.([a-z]{2,6})/i'$input$match) && in_array($match[1], $tlds);



webarto 23. 07. 2012. 16:18

@ivanhoe, mislio sam da postavi taj jedan spam post, da ne ubadamo...

http://ideone.com/aPqux

PHP kôd:

<?php

$input 
"http://www.youtube.com/watch?v=itvJybdcYbI text [url=http://static.youtube.com/watch?v=itvJybdcYbI]What's up?[/url] text youtube.com/watch?v=itvJybdcYbI text www.youtube.com/watch?v=itvJybdcYbI";

echo 
can_haz_linkz($input)? 'Y''N';

$input "text [url=http://static.youtube.com/watch?v=itvJybdcYbI]What's up?[/url] text";

echo 
can_haz_linkz($input)? 'Y''N';

function 
can_haz_linkz($input)
{
    return 
preg_match(
        
"#([\w-]+:\/\/?|(www|([\w]+))[.])[^\s()<>\[\]]+(?:\([\w\d]+\)|([^[:punct:]\s]|\/))#is"
        (
preg_replace("#\[url=(.*?)/url\]#is"''$input))
    );
}


Bojsi 23. 07. 2012. 17:46

Hvala, sad cu da isprobam.

Spam je sasvim obican. Gomila teksta (bez html tagova) i ponegde url. Evo jednog:

Kôd:

http://www.megacenter.dk/phpBB3/viewtopic.php?f=19&t=179269&p=206614#p206614

http://www.giagz.com/post/viewtopic.php?f=7&t=498104&p=651775#p651775

http://forum.cliptricks.com/viewtopic.php?f=11&t=643309&p=919764#p919764

You will never know how it feels until you truly own a pair of Christian Louboutin.. For the past 15 years, Robbins has been doing exactly that. After being on the pill for more than 10 years, my period was really short, brown, and low flow with spotting for several days before actually starting. Initially, I would welcome feedback on what I presented as the preliminary steps. Born shoes are constructed from a perfect leading material. You might not be able to get hold of the right provider with the best possible deal in the very first search without any issues.


webarto 23. 07. 2012. 18:00

Trebalo bi da radi: http://rubular.com/r/PSQoFEJi8v

Br@nkoR 24. 07. 2012. 10:56

Možda:
PHP kôd:

function has_links($input) {
  
$url '([\w-]+:\/\/?|(www|([\w]+))[.])[^\s()<>\[\]]+(?:\([\w\d]+\)|([^[:punct:]\s]|\/))'// @webarto
  
$pattern '/(' $url ')(?!(?:.(?!\[url(=' $url ')?\]))*\[\/url\])/i';
  return 
preg_match_all($pattern$input);
}

$text '[url=www.site.com]site[/url] sdf sadf https://www.site2.rs/ asdf 
asdf https://www.site3.com [url]www.devprotalk.com[/url] 6gfghgh http://www.site4.com 78tzuzu'
;

var_dump(has_links($text));

$text 'sadasd [url=www.site.com]site[/url] sdf sadf [url]http://www.devprotalk.com[/url]';

var_dump(has_links($text));

$text 'http://www.megacenter.dk/phpBB3/viewtopic.php?f=19&t=179269&p=206614#p206614

http://www.giagz.com/post/viewtopic.php?f=7&t=498104&p=651775#p651775

http://forum.cliptricks.com/viewtopic.php?f=11&t=643309&p=919764#p919764

You will never know how it feels until you truly own a pair of Christian Louboutin.. For the past 15 years, Robbins has been doing exactly that. After being on the pill for more than 10 years, my period was really short, brown, and low flow with spotting for several days before actually starting. Initially, I would welcome feedback on what I presented as the preliminary steps. Born shoes are constructed from a perfect leading material. You might not be able to get hold of the right provider with the best possible deal in the very first search without any issues.'
;

var_dump(has_links($text)); 


Bojsi 25. 07. 2012. 03:24

Hvala i tebi. Nisam stigao jos da isprobam, ali siguran sam da ce neki od njih raditi. Zaboravio sam da kazem da ce url biti moguc i unutar IMG taga, ali vidim da ste vodili racuna i o tome :)

tnx again!


Vreme je GMT +2. Trenutno vreme je 19:17.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2017, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.