DIV -Inhalt aus htmlSource in String (Java) extrahieren

https://stackoverflow.com/questions/836462

08-07-2019
|

Frage

Ich versuche, den Inhalt eines speziellen Div-Tags (definiert durch seinen Klassennamen) aus einer Zeichenfolge zu extrahieren, die HTML-Quelle enthält. Ich denke, die Regexp-Merkmale von Java sind nicht so einfach zu bedienen wie in Perl, oder?

Hat jemand das schon einmal getan und kann mir ein Stück Code geben? Vielleicht ist Dom-Browsing eine gute Lösung, aber ich habe keine Tutorials gefunden, die mit meinem Problem übereinstimmen.

Lösung

Basierend auf Ihren Kommentaren klingt es so, als hätten Sie einen allgemeinen Fall ("Crawler") und somit eine XML -Datei effektiv analysieren. Wenn die Quellseite XHTML ist, haben Sie eine Vielzahl von Optionen in verschiedenen XML -Bibliotheken. (Zum Beispiel jdom).

Andere Tipps

Du könntest benutzen HTML -Parser oder eine andere HTML -Parsing -Bibliothek daraus aufführen.

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow