schermo Php raschiando con PHP semplice dom parser
-
11-10-2019 - |
Domanda
Sto usando semplice DOM HTML parser per raschiare un sito web ... Come posso saltare una classe particolare, mentre in un ciclo
Soluzione
A giudicare da http://simplehtmldom.sourceforge.net/manual.htm#frag_find_attr è possibile utilizzare:
->find("div[class!=skip_me]")
In alternativa, utilizzare i metodi DOM e verificare con ->getAttribute("class")
contro un valore.
Altri suggerimenti
// DOM can load HTML soup. But, HTML soup can throw warnings, suppress
// them.
$htmlDom = new DOMDocument();
@$htmlDom->loadHTML($html);
if ($htmlDom) {
// It's much easier to work with simplexml than DOM, luckily enough
// we can just simply import our DOM tree.
$elements = simplexml_import_dom($htmlDom);
Questa è una citazione (quasi) da Drupal 7 SimpleTest. Dopo questo, è molto più facile lavorare con il documento, la classe può essere portata da $ elemento [ 'classe']
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow