Citat:
Originalno napisao ivanhoe
ali svakako radi bolje od parsiranja XML parserima, jer to ne radi uopste sem sa staticnim i 100% validnim stranama..
|
Juče sam tek malo ozbiljnije pogledao dokumentaciju za ovo (juče mi je prvi put zatrebalo

), ali čini mi se da je u PHP-u to fino rešeno. Domdocument ima metod loadXML koji očekuje savršeno formatiran kôd, ali tu je i loadHTML koji radi isto, samo ne paniči ako fali neki tag.
http://www.php.net/manual/en/domdocument.loadhtml.php
Citat:
The function parses the HTML contained in the string source. Unlike loading XML, HTML does not have to be well-formed to load. This function may also be called statically to load and create a DOMDocument object. The static invocation may be used when no DOMDocument properties need to be set prior to loading.
|