PHP: Los datos de rulos, HTML Scan

https://stackoverflow.com/questions/1971373

21-09-2019
|

Pregunta

¿Cómo puedo escanear una página HTML, para el texto dentro de un cierto div?

Solución

La forma más sencilla de hacer esto sería usar simple HTML DOM analizador

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');

Otros consejos

También puede hacer esto utilizando la clase DOMDocument.

El uso es bastante recta hacia adelante:

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

La documentación es aquí .

Un ejemplo del uso del mundo real se puede encontrar aquí .

Se podría utilizar la acumulación en la funcionalidad según lo sugerido por otros o puede probar con el simple HTML DOM analizador se implementa como un simple clase PHP y algunas funciones de ayuda. Es compatible con pantalla de estilo CSS selector de raspado (como en jQuery), puede manejar HTML no válido, e incluso proporciona una interfaz familiar para manipular un DOM.

Vale la pena echarle un vistazo en http://simplehtmldom.sourceforge.net/

preg_match() para que coincida con la subcadena que quiere o uso dom / xml.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow