Pregunta

¿Cómo puedo escanear una página HTML, para el texto dentro de un cierto div?

¿Fue útil?

Solución

La forma más sencilla de hacer esto sería usar simple HTML DOM analizador

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');

Otros consejos

También puede hacer esto utilizando la clase DOMDocument.

El uso es bastante recta hacia adelante:

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

La documentación es aquí .

Un ejemplo del uso del mundo real se puede encontrar aquí .

Se podría utilizar la acumulación en la funcionalidad según lo sugerido por otros o puede probar con el simple HTML DOM analizador se implementa como un simple clase PHP y algunas funciones de ayuda. Es compatible con pantalla de estilo CSS selector de raspado (como en jQuery), puede manejar HTML no válido, e incluso proporciona una interfaz familiar para manipular un DOM.

Vale la pena echarle un vistazo en http://simplehtmldom.sourceforge.net/

preg_match() para que coincida con la subcadena que quiere o uso dom / xml.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top