php pantalla raspado usando intérprete PHP sencilla dom
-
11-10-2019 - |
Pregunta
Estoy usando simples HTML DOM analizador para raspar una página web ... ¿Cómo puedo saltar una clase particular, mientras que en el circuito
Solución
A juzgar por http://simplehtmldom.sourceforge.net/manual.htm#frag_find_attr puede utilizar:
->find("div[class!=skip_me]")
O utilizar los métodos DOM y comprobar con ->getAttribute("class")
contra un valor.
Otros consejos
// DOM can load HTML soup. But, HTML soup can throw warnings, suppress
// them.
$htmlDom = new DOMDocument();
@$htmlDom->loadHTML($html);
if ($htmlDom) {
// It's much easier to work with simplexml than DOM, luckily enough
// we can just simply import our DOM tree.
$elements = simplexml_import_dom($htmlDom);
Esta es una cita (casi) de Drupal 7 SimpleTest. Después de esto, es un trabajo mucho más fácil con el documento, la clase puede ser alcance como elemento $ [ 'clase']
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow