Frage

Wie kann ich eine HTML-Seite scannen, für Text innerhalb eines bestimmten div?

War es hilfreich?

Lösung

Der einfachste Weg, dies zu tun wäre Einfache HTML-DOM-Parser

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');

Andere Tipps

Sie können auch tun dies die DOMDocument Klasse.

Die Benutzung ist ziemlich geradlinig:

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

Die Dokumentation ist hier .

Ein Beispiel für reale Welt Verwendung finden kann hier .

Sie können bauen in Funktionalität verwenden, wie von anderen vorgeschlagen oder Sie könnten die einfache HTML-DOM-Parser versuchen, als eine einfache PHP-Klasse implementiert und einige Hilfsfunktionen. Es unterstützt CSS-Bildschirm Wähler Stil (wie in jQuery) Schaben können ungültige HTML verarbeiten und bietet sogar eine vertraute Benutzeroberfläche einen DOM zu manipulieren.

Es lohnt sich zu prüfen, unter http://simplehtmldom.sourceforge.net/

preg_match() entsprechen die Teilzeichen Sie wollen oder Verwendung dom / xml.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top