DevProTalk

DevProTalk (http://www.devprotalk.com/index.php)
-   (X)HTML, JavaScript, DHTML, XML, CSS (http://www.devprotalk.com/forumdisplay.php?f=8)
-   -   fetch podataka sa drugih sajtova (http://www.devprotalk.com/showthread.php?t=10060)

webarto 01. 11. 2011. 20:31

http://ideone.com/iXYHO

PHP kôd:

$string '<p class="gen">
<u>
<br/>
<br/>
<strong>A</strong>
 Ulica 122, 11000 BG
<br/>
<strong>T</strong>
  011 22 222222 333
<br/>
<strong>M</strong>
 098 4 344 8230  
<br/>
    066 4433 44 111
<br/>
<strong>W</strong>'
;

$string preg_replace('#(<(.*?)>(.*?)</(.*?)>|<(.*?)>)#is'''$string);

$string explode("\n"$string);

foreach(
$string as $key => &$value)
    if(
$key == 0) unset($string[$key]);

print_r($string); 

Možeš koristiti i preg_split, malo je ovo zeznuto jer nije regularno...

AdriaMart 01. 11. 2011. 20:33

aha, hvala znaci ipak mora regex nemoze xpath...

webarto 01. 11. 2011. 20:37

Ne znam da li može xpath, pretpostavljam da ne, "The <br> tag is an empty tag which means that it has no end tag.", hoće reći nije zatvoren, recimo ovaj strong bi mogao... Možeš i da matchuješ između </strong> i <strong>, ali u slučaju da bude nešto drugo, će da pukne...

AdriaMart 01. 11. 2011. 20:39

da, znam za strong ali ovaj br tag je problematican, video sam negde da pisu //br/text() ali ni to ne pali

Br@nkoR 02. 11. 2011. 09:40

Pogledaj Axes, nešto napamet: //p[@class='gen']/br/following-sibling::text() ili //p[@class='gen']/text()[preceding::br] ne znam koji podatak je potrebno izvući, nešto za posebne vrednosti adresu npr. normalize-space(string(//p[@class='gen']/strong[text() = 'A']/following-sibling::text()))

AdriaMart 03. 11. 2011. 00:41

Da, ovi kodovi rade dobro. hvala

AdriaMart 04. 11. 2011. 13:52

offtopic:OBECAVAM da je ovo zadnje pitanje koje sam postavio u ovoj temi, iskreno se nadam da jos nekome koristi.

Napisao sam sledece:

$string = $xpath2->query("html/body/div/div[1]/div[3]/div[1]/div[2]/div/div[5]/script");
$string=addslashes($string);


//koordinate
if( extract_ll($string) ) { list($lat, $lng) = extract_ll($string); }
else {
break;
}

za sajt grupko.rs, medjutim izgleda da mi je string prazan ??? Zbog cega. Jeli greska u xpath sintaksi?

Inace funkcija ''extract_ll'' dobro radi i dobijam je sa include_once('funkcija.php'); u kojoj se nalazi proveren regex kod. koji izlvlaci koordinate. Ne prijavljuje gresku jer mi je izgleda string prazan ali ZASTO?

AdriaMart 04. 11. 2011. 21:03

Ne radi cak ni najosnovniji kod:
<?php
$dom = new DOMDocument();
@$dom->loadHTMLFile('http://www.grupko.rs/sr/ponuda/490-dinara-umesto-1-600-dinara-za-ojacavanje-prirodnih-noktiju-gelom-sa-trajnim-frencom-ili-lakiranjem-po-zelji/181');
$xpath = new DOMXPath($dom);
echo $xpath->query("//div[@id='margin-top-10'][@class='belo-polje'][2]/script")->item(0)->textContent;


?>

Br@nkoR 04. 11. 2011. 22:21

Izbaci [2], dakle:
Kôd:

//div[@id='margin-top-10'][@class='belo-polje']/script
ili deo ispred [2] stavi unutar zagrada:
Kôd:

(//div[@id='margin-top-10'][@class='belo-polje'])[2]/script
ili nešto slično kao prvi:
Kôd:

//div[@id='margin-top-10' and @class='belo-polje']/script

Ovo: html/body/div/div[1]/div[3]/div[1]/div[2]/div/div[5]/script ne radi zato što nije validan html kod, tačnije problem je u js kodu, stranice sa koje dovlačiš sadržaj.

webarto 04. 11. 2011. 22:23

Smeće je HTML, nisi ti kriv :)

PHP kôd:

$x $xpath->query("//div[@id='margin-top-10']");
echo 
$x->item(3)->textContent

Kôd:

                                        //<![CDATA[
                                        var html = '';
                                        var lat  = 44.79766500750019;
                                        var lang = 20.49371838569641;
                                        if (GBrowserIsCompatible())
                                        {
                                            var map = new GMap2(document.getElementById("map_canvas"));
                                            var ct = new GLatLng(lat, lang);
                                            map.setCenter(ct, 15);
                                            map.addControl( new GSmallMapControl() );
                                            //map.addControl( new GHierarchicalMapTypeControl () );
                                            var gm=new GMarker(ct);
                                            if(html != '') {
                                                GEvent.addListener(gm, "click", function() {
                                                    this.openInfoWindowHtml( html );
                                                });
                                            }
                                            map.addOverlay(gm);
                                            map.enableContinuousZoom();
                                            map.enableInfoWindow();
                                        }
                                        //]]>


AdriaMart 05. 11. 2011. 00:04

Hvala Vam!!!!!!!!!!!!!!!!!!!!!!!!!!!!

AdriaMart 02. 12. 2011. 22:11

Koliko je pametno da sa curl-om vucem stotinak stranica za skraping. Ima li neko ideju kako da ucinim da se to izvrsava paralelno, to sve stranice istovremeno a da ne razdvajam stranice (tj. da nemam poseban fajl (kod) za svaku stranu) vec sa jednom da to organizujem. Znaci najpre preuzmem listu gradova zatim grad po grad i ponudu po ponudu... ima li nacina da se to radi paralelno?

ivanhoe 03. 12. 2011. 00:46

u php-u imas curl_multi_* funkcije, to sluzi za to...

slavkan 26. 02. 2012. 01:01

Ljudi jel bi neko pomogao da preuzmem trenutnu temperaturu grada beograda sa ovog linka:

Kôd:

http://www.viamichelin.com/web/Meteo?strLocid=31NDIxOTMxMGNORFF1T0RBMU56ST1jTWpBdU5EZzBNRFk9
Ja sam nesto pokusavao ali mi ne uspeva da pravilno napisem putanju do id-a gde se stampa trenutna temperatura

Kôd:

$html = new DOMDocument();
@$html->loadHtmlFile('http://www.viamichelin.com/web/Meteo?strLocid=31NDIxOTMxMGNORFF1T0RBMU56ST1jTWpBdU5EZzBNRFk9');
$xpath = new DOMXPath( $html );
$nodelist = $xpath->query( "//div[@id='weatherTemperature']" );
foreach ($nodelist as $n){
echo $n->nodeValue."\n";
}


sinisake 26. 02. 2012. 12:08

Pa sta fali ovome? Radi, zar ne? :1007:

slavkan 26. 02. 2012. 13:55

Pa ne radi. Putanja do ovog <div id='weatherTemperature'> nije dobra.


Vreme je GMT +2. Trenutno vreme je 10:29.

Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.

Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.