Frage

Ich versuche zu lernen, wie man HTML analysiert, aber da ich weder in Java noch in Android viel Erfahrung habe, ist es ein wenig kompliziert. Ich habe das IBM XML -Parsing -Tutorial gelesen und gelernt, einen RSS -Feed zu analysieren. Mein Problem ist: Ich möchte Daten von einer HTML -Site erhalten. Ich habe einige Informationen zu HTML Cleaner, JSON usw. gelesen, aber ich kann kein gutes Tutorial finden, um mir zu helfen. Haben Sie Tutorials, die hilfreich sein könnten?

Vielen Dank.

War es hilfreich?

Lösung

Schauen Sie sich die folgenden HTML -Parser an. Es gibt mehr da draußen. Vielleicht arbeitet man für Sie:

Andere Tipps

IMO Es gibt zwei einfache Möglichkeiten, HTML zu analysieren:

  • Konvertieren Sie die HML mit einer Bibliothek (z. B. HTMLTIDY) in XML (XHTML) und verwenden Sie dann einen XML -Parser
  • Verwenden Sie einen vorhandenen HTML-Parser (z. B. einen Standard-Webbrowser wie Webkit, ForeFox und/oder IE) und lesen

Wenn Sie Ihren eigenen Parser schreiben möchten (was ich bezweifle, dass Sie für Hausaufgaben sind: Es wäre lang und kompliziert, ihn ordnungsgemäß/vollständig umzusetzen), sehen Sie sich das an die Spezifikationen für das Parsen von HTML.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top