Pregunta

Estoy usando simples HTML DOM analizador para raspar una página web ... ¿Cómo puedo saltar una clase particular, mientras que en el circuito

¿Fue útil?

Solución

A juzgar por http://simplehtmldom.sourceforge.net/manual.htm#frag_find_attr puede utilizar:

->find("div[class!=skip_me]")

O utilizar los métodos DOM y comprobar con ->getAttribute("class") contra un valor.

Otros consejos

  // DOM can load HTML soup. But, HTML soup can throw warnings, suppress
  // them.
  $htmlDom = new DOMDocument();
  @$htmlDom->loadHTML($html);
  if ($htmlDom) {
    // It's much easier to work with simplexml than DOM, luckily enough
    // we can just simply import our DOM tree.
    $elements = simplexml_import_dom($htmlDom);

Esta es una cita (casi) de Drupal 7 SimpleTest. Después de esto, es un trabajo mucho más fácil con el documento, la clase puede ser alcance como elemento $ [ 'clase']

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top