DevProTalk

Forumi IT profesionalaca
web development, web design, e-business, SEO


Idite nazad   DevProTalk > Web development i web aplikacije > (X)HTML, JavaScript, DHTML, XML, CSS
Želite da se reklamirate ekskluzivno na ovoj poziciji? Javite se

(X)HTML, JavaScript, DHTML, XML, CSS Client scripting tehnologije, Dynamic HTML, Cascading Stylesheets, XML i standardi

Odgovori
 
Alati teme Način prikaza
Staro 29. 07. 2011.   #121
slavkan
profesionalac
Professional
 
Datum učlanjenja: 30.08.2010
Poruke: 201
Hvala: 10
640 "Hvala" u 14 poruka
slavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished road
Default

Citat:
Originalno napisao 357_97 Pogledajte poruku
Ljudi napisali celu knjigu o tome. Potrazi po netu php|architect's Guide to Web Scraping ili pogledaj link na amazonu!
ih da kupujem knjigu radi necega sto moze stati na jednu stranicu!
Meni treba samo da neko objasni par mogucih varijanti ovoga:

Kôd:
$xpath->query("//h2[@class='title']")->item(0)->textContent;
tj sta se sve moze naci izmedju ovih navodnika i to je to !
slavkan je offline   Odgovorite uz citat
Staro 29. 07. 2011.   #122
webarto
expert
Grand Master
 
Avatar webarto
 
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
webarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished road
Default

http://php.net/manual/en/simplexmlelement.xpath.php
http://www.w3schools.com/xpath/
__________________
Github // LinkedIn // PHP // ZCE // Stackoverflow PHP // Site5 Web Hosting
webarto je offline   Odgovorite uz citat
Staro 29. 07. 2011.   #123
slavkan
profesionalac
Professional
 
Datum učlanjenja: 30.08.2010
Poruke: 201
Hvala: 10
640 "Hvala" u 14 poruka
slavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished road
Default

prostudiracu, hvala !
slavkan je offline   Odgovorite uz citat
Staro 29. 07. 2011.   #124
slavkan
profesionalac
Professional
 
Datum učlanjenja: 30.08.2010
Poruke: 201
Hvala: 10
640 "Hvala" u 14 poruka
slavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished roadslavkan is on a distinguished road
Default

Nece pa nece Da li je neko raspolozen da izparsiramo ovaj link i uz put da diskutujemo:

Kôd:
http://www.viamichelin.com/web/Meteo?strLocid=31NDIxZzMxMGNORE11T0RVNU1UWT1jTVRndU5ETXpPRGs9
Ja sam nesto pokusao ovako:

Kôd:
function curl($url){
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_URL, $url);
        curl_setopt($ch, CURLOPT_ENCODING, "gzip");
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        $data = curl_exec($ch);
        curl_close($ch);
        return $data;
}

$html = curl('http://www.viamichelin.com/web/Meteo?strLocid=31NDNhZGwxMGNOREl1T0RjeE5qVT1jTVRndU5ERTNNamc9'); 

preg_match_all('#<div class="sMainForecast"(.*?)</div></div>#is', $html, $matches); 
$matches = implode("", $matches[0]); 
echo $matches;
Dobijem nekih rezultata ali nije to to Kako ovo malo posloziti, kako uzeti ove slicice, da li bi se nekako moglo uzimati deo po deo i tako da i vrsim stampanje, recimo uzmem trenutnu temperaturu i slicicu pored pa ostampam, pa uzmem ove zajebancije o vetru pa ih ostampam, pa onda uzmem ove dole slicice pa ih stampam itd...
slavkan je offline   Odgovorite uz citat
Staro 29. 07. 2011.   #125
webarto
expert
Grand Master
 
Avatar webarto
 
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
webarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished road
Default

Ja mislim da kod ViaMichelin JS generiše HTML, idi na Disable JS, i otvori Source da vidiš kakva je situacija i gdje se to nalazi, vjerovatno su escapeovani specijalni karakteri.

http://webarto.com/53/viamichelin-php-class
__________________
Github // LinkedIn // PHP // ZCE // Stackoverflow PHP // Site5 Web Hosting
webarto je offline   Odgovorite uz citat
Staro 30. 09. 2011.   #126
AdriaMart
expert
Expert
 
Avatar AdriaMart
 
Datum učlanjenja: 15.03.2011
Poruke: 518
Hvala: 16
20 "Hvala" u 17 poruka
AdriaMart is on a distinguished road
Default

Kako to da ovaj kod na jednom serveru radi kupondo.adriamart.com/grupovina1.php a na drugom pluspon.com/grupovina1.php NE


<?php


function curl($url){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_ENCODING, "gzip");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec($ch);
curl_close($ch);
return $data;
}

$dom = new DOMDocument();
@$dom->loadHTMLFile('http://www.grupovina.rs/beograd/');
$xpath = new DOMXPath($dom);
$entries = $xpath->query("//div[@class='deal-medallion-heading']//h1//a/@href");
$output = array();
foreach($entries as $e) {
$dom2 = new DOMDocument();
@$dom2->loadHTMLFile($e->textContent);
$xpath2 = new DOMXPath($dom2);
$data = array();
$data['link']= ($e->textContent);
$data['naslov'] = trim($xpath2->query("//div[@class='inner-deal-heading']//h2")->item(0)->textContent);
$data['slika'] = trim($xpath2->query("//li/img/@src")->item(0)->textContent);

$location = $xpath2->query("//div[@class='inner-deal-column-block']//script")->item(1)->textContent;
preg_match('/var\s+latitude\s+=\s+(\d+\.\d+)\s*;/', $location, $lat);
preg_match('/var\s+longitude\s+=\s+(\d+\.\d+)\s*;/', $location, $lng);
$data['lat'] = $lat[1];
$data['lng'] = $lng[1];

$image_url = $data['slika'];
$ch = curl_init();
$timeout = 0;
curl_setopt ($ch, CURLOPT_URL, $image_url);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);


$image = curl_exec($ch);
curl_close($ch);

$novalat = str_replace ('.','',$data['lat']);

$lele = 'slike/'.$novalat.'.jpg';
$lele = str_replace(' ', '-', $lele);

$i = $i+1;


$f = fopen($dyhgu, 'w');
fwrite($f, $image);
fclose($f);


$naslov = $data['naslov'];
$latitude = $data['lat'];
...... i tako dalje;


$latitude = (float) $latitude;
$longitude = (float) $longitude;



mysql_connect ("localhost", "dddddddddddd", "aaaaaaaa") or die ('Error: '.mysql_error());

mysql_select_db ("ddddddddddd");

$naslov = mysql_real_escape_string($naslov);


$query="INSERT INTO markers (location_ID, name, lat, lng, ITD!... ) VALUES (NULL,'$... ... ... $... ... .. ...')"; mysql_error();

mysql_query($query) or die ('Error updating database');

echo "Baza je updejtovana sa: " .$... ... ... ....." ";



$output[] = $data;
}







?>


Postoje jos nekoliko takvih fajlova koji se neizvrsavaju iako nema greske u kodu, sta bi mogao da bude razlog za to?

Poslednja izmena od AdriaMart : 30. 09. 2011. u 18:46.
AdriaMart je offline   Odgovorite uz citat
Staro 30. 09. 2011.   #127
webarto
expert
Grand Master
 
Avatar webarto
 
Datum učlanjenja: 11.04.2010
Poruke: 998
Hvala: 141
959 "Hvala" u 153 poruka
webarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished roadwebarto is on a distinguished road
Default

Nemaš cURL (možda je upaljen safe_mode) ili neki drugi modul..

PHP kôd:
error_reporting(E_ALL E_NOTICE);
ini_set('display_errors'1); 
__________________
Github // LinkedIn // PHP // ZCE // Stackoverflow PHP // Site5 Web Hosting
webarto je offline   Odgovorite uz citat
Staro 30. 09. 2011.   #128
AdriaMart
expert
Expert
 
Avatar AdriaMart
 
Datum učlanjenja: 15.03.2011
Poruke: 518
Hvala: 16
20 "Hvala" u 17 poruka
AdriaMart is on a distinguished road
Default

da, ali drugi fajlovi koji izvlace ponude sa drugih sajtova rade bez problema jedino ovaj pravi probleme???
AdriaMart je offline   Odgovorite uz citat
Staro 30. 09. 2011.   #129
Br@nkoR
banned
Professional
 
Avatar Br@nkoR
 
Datum učlanjenja: 04.06.2005
Poruke: 371
Hvala: 0
738 "Hvala" u 83 poruka
Br@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoroBr@nkoR će postati "faca" uskoro
Default

Proveri ove XPath izraze za izvlačenje podataka sa pojedinačnih stranica.
__________________
Don't look at me; I'm lost too.
“If you can't dazzle them with brilliance, baffle them with bul*s**t.”
Br@nkoR je offline   Odgovorite uz citat
Staro 30. 09. 2011.   #130
AdriaMart
expert
Expert
 
Avatar AdriaMart
 
Datum učlanjenja: 15.03.2011
Poruke: 518
Hvala: 16
20 "Hvala" u 17 poruka
AdriaMart is on a distinguished road
Default

Citat:
Originalno napisao Br@nkoR Pogledajte poruku
Proveri ove XPath izraze za izvlačenje podataka sa pojedinačnih stranica.
nisam sigurna da sam razumeo bas najbolje ?
AdriaMart je offline   Odgovorite uz citat
Odgovori



Pravila pisanja
Možete ne započinjati nove teme
Možete ne slati odgovore
Možete ne slati priloge
Možete ne izmeniti svoje poruke
vB kôd je Uključen
Smajliji su Uključen
[IMG] kod je Uključen
HTML kôd je Isključen
Pogledajte forum


Vreme je GMT +2. Trenutno vreme je 01:22.


Powered by vBulletin® Verzija 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Copyright © DevProTalk. All Rights Reserved.
Mišljenja, saveti, izjave, ponude ili druge informacije ili sadržaji nastali na Sajtu su vlasništvo onoga ko ih je kreirao, a ne DevProTalk.com, tako da ne morate da se oslanjate na njih.
Autori poruka su jedini odgovorni za ovakve sadržaje. DevProTalk.com ne garantuje tačnost, kompletnost ili upotrebnu vrednost informacija, stavova, saveta ili datih izjava. Ne postoje uslovi pod kojima bi mi bili odgovorni za štetu ili gubitak koji je posledica bilo čijeg oslanjanja na nepouzdane informacije, ili bilo kakve informacije nastale kroz komunikaciju između registrovanih članova.
Web sajt može sadržavati linkove na druge web sajtove na Internetu ili neke druge sadržaje. Ne kontrolišemo niti podržavamo te druge web sajtove, niti smo pregledali bilo kakve sadržaje na takvim sajtovima. Mi nećemo biti odgovorni za legalnost, tačnost ili prikladnost bilo kog sadržaja, oglasa, proizvoda, usluga ili informacije lociranim na ili distribuiranih kroz druge web sajtove, niti za bilo kakvu štetu nastalu kao posledica takvih informacija. DevProTalk.com drži i čuva druga prava vlasništva na web sajtu. Web sajt sadrže materijale zaštićene copyright-om, zaštitne znakove i druge informacije o pravu vlasništva ili softver. Članovi mogu poslatu informacije zaštićene pravima vlasništva njihovih nosilaca i ona ostaju zaštićena bez obzira da li su oni koji prenose te informacije to naveli ili ne. Osim informacija koje su u javnom vlasništvu ili za koje dobijete dozvolu, nemate pravo da kopirate, modifikujete ili na bilo koji način menjate, objavljujete, prenosite, distribuirate, izvršavate, prikazujete ili prodajte bilo koju informaciju zaštićenu pravima vlasništva. Slanjem informacija ili sadržaja na bilo koji deo DevProTalk.com, Vi automatski dozvoljavate i predstavljate garanciju da imate pravo da dozvolite DevProTalk.com ili članovima DevProTalk.com bespovratnu, kontinualnu, neograničenu, globalnu dozvolu da koriste, kopiraju, izvršavaju, prikazuju i distribuiraju takve informacije i sadržaje i da iz takvih sadžaja koriste bilo koji deo u bilo koje svrhe, kao i pravo i dozvolu da koriste gore navedene sadržaje. Svi zaštitni znakovi (trademarks), logotipi, oznake usluga, firme ili imena proizvoda koji se pominju na ovom web sajtu su vlasništvo kojim raspolažu njihovi vlasnici.