Regular expression i htaccess regex, PCRE, POSIX, upotreba Apache .htaccess , mod_rewrite |
![]() |
|
Alati teme | Način prikaza |
![]() |
#1 |
Nekad bio ddz
Expert
|
![]() Imam zadatak da gomilu teksta (15 brojeva časopisa, svaki po 300 strana) iz PDFa prebacim u wordpress. PDFovi su spremani za štampu, tako da uredno imaju line break na kraju svakog reda.
Svaki članak posebno prebacujem u editor (u mom slučaju Ultra Edit), i propuštam ga kroz dva makroa koja sam za ovu priliku sklepao: jedan za konverziju YUSCII->Unicode, i drugi koji preko regexpa prvo skloni sve crtice sa kraja reda, a onda ubija nepotrebne line-breakove: Kôd:
^(.*[^.])\p Sve je sjajno radilo, sve dok nisam primetio da u delovima nekih članaka moraju da postoje linebreakovi, jer se radi o stihovima ili dijalozima. Izmenio sam malo string za pretragu, tako da spaja redove jedino ako imaju preko 50 karaktera: Kôd:
^(.{50,}[^.])\p ![]() |
![]() |
![]() |
![]() |
#3 |
Ivan Dilber
Sir Write-a-Lot
|
![]() nije pametno baviti se regexpima posle beer festa, ali ajd da probam
![]() a) da li UltraEdit podrzava {} sintaxu? Textpad ne podrzava... b) probaj da umesto {50,} stavis {1,} da vidis da li ces dobiti nesto. Ako je ovaj matching line oriented, mozda su linije krace od 50 ili tako nesto glupo... c) \p je oznaka za unicode(ali ide ispred izraza, ne iza), ja bih ocekivao da ces koristiti \r\n ili \s+ na tom mestu da uhvatis novu liniju
__________________
Leadership is the art of getting people to want to do what you know must be done. |
![]() |
![]() |
![]() |
#4 |
banned
Professional
Datum učlanjenja: 04.06.2005
Poruke: 371
Hvala: 0
738 "Hvala" u 83 poruka
![]() ![]() ![]() ![]() ![]() ![]() ![]() |
![]() Možda:
Kôd:
^(...................................................*[^.])\p ![]()
__________________
Don't look at me; I'm lost too. “If you can't dazzle them with brilliance, baffle them with bul*s**t.” Poslednja izmena od Br@nkoR : 17. 08. 2007. u 12:46. |
![]() |
![]() |
![]() |
#5 | |
Nekad bio ddz
Expert
|
![]() @borstale:
![]() @ivanhoe: Probao sam sa + i {1,}, da vidim da li će dati isti rezultat. Ovo drugo nije uhvatilo ništa, tako da je vrlo verovatno da UEdit ne konta ovakve brojače. Ono što me je zabrinulo je to što search string sa plusom umesto zvezdice daje jako čudne rezultate (hvata cele redove, ali samo one posle kojih stoje dva cr/lf-a). Za \p sam znao da hvata blokove unicode karaktera, pa me je iznenadio UltraEditov help, koji za \p kaže: Citat:
@Br@nkoR: Stari, dobri buzdovan-metod. Izgleda šašavo, ali deluje! ![]() Hvala, ko zna kad bi mi ovako nešto palo na pamet ![]() Poslednja izmena od Dušan Dželebdžić : 17. 08. 2007. u 17:27. |
|
![]() |
![]() |
![]() |
#6 |
Nekad bio ddz
Expert
|
![]() Prerano sam se poradovao, ovo je sredilo jedan problem, ali je kasnije stvorilo nekoliko novih. Koji mi editor za Win preporučujete, a da ima osnovnu podršku za makroe, i da podržava standardnu sintaksu regexpa?
|
![]() |
![]() |
![]() |
#7 |
Knowledge base
Wrote a book
Datum učlanjenja: 16.06.2005
Lokacija: Novi Sad
Poruke: 1.437
Hvala: 37
131 "Hvala" u 82 poruka
![]() ![]() |
![]() Perl
![]() Nije editor ali ce odlicno raditi ![]()
__________________
Năo quero mais seguir um só caminho |
![]() |
![]() |
![]() |
#9 | |
Ivan Dilber
Sir Write-a-Lot
|
![]() Citat:
Mozda Scite kao predlog editora, on deluje kao da radi lepo, mada se slazem sa Morenom, instaliraj perl ili php cli i napravi skriptu koja radi sta god pozelis, jebes editore i makroe... recimo za perl, one-liner je nesto tipa perl -p -i.BCKP -e "s/search_term/replace_term/gi" neki.fajl
__________________
Leadership is the art of getting people to want to do what you know must be done. |
|
![]() |
![]() |
![]() |
#10 |
Nekad bio ddz
Expert
|
![]() Izgleda da sam bio u pravu kad sam temu prvobitno postavio u PHP forum
![]() Pretpostavljam da je perl bolje rešenje, ali o njemu znam jedino da ima "mačka mi skočila na tastaturu" sintaksu, tako da će biti efikasnije ako posao odradim u PHPu. Hvala svima na savetima. |
![]() |
![]() |
![]() |
Alati teme | |
Način prikaza | |
|
|
![]() |
||||
Tema | Početna poruka teme | Forum | Odgovori | Poslednja poruka |
Regexp i naša slova | Dragan Babić | Regular expression i htaccess | 7 | 06. 09. 2006. 16:37 |
Text file regexp validator | Blood | Regular expression i htaccess | 10 | 13. 03. 2006. 13:57 |