Frage

Ich versuche, den Inhalt eines speziellen Div-Tags (definiert durch seinen Klassennamen) aus einer Zeichenfolge zu extrahieren, die HTML-Quelle enthält. Ich denke, die Regexp-Merkmale von Java sind nicht so einfach zu bedienen wie in Perl, oder?

Hat jemand das schon einmal getan und kann mir ein Stück Code geben? Vielleicht ist Dom-Browsing eine gute Lösung, aber ich habe keine Tutorials gefunden, die mit meinem Problem übereinstimmen.

War es hilfreich?

Lösung

Basierend auf Ihren Kommentaren klingt es so, als hätten Sie einen allgemeinen Fall ("Crawler") und somit eine XML -Datei effektiv analysieren. Wenn die Quellseite XHTML ist, haben Sie eine Vielzahl von Optionen in verschiedenen XML -Bibliotheken. (Zum Beispiel jdom).

Andere Tipps

Du könntest benutzen HTML -Parser oder eine andere HTML -Parsing -Bibliothek daraus aufführen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top