HTML mit Perl analysieren
-
27-10-2019 - |
Frage
Ich habe das folgende html-
<a href="http://address.com">John</a>: I really <b>love</b> <b>soccer</b>;
Ich möchte es in ein CSV analysieren, wo ich hätte
Name = John
Kommentar = Ich liebe Fußball wirklich.
Schlüsselwörter = Liebe, Fußball
In der Konsolen -App wird jede Hilfe sehr geschätzt.
Lösung
Hier ist ein Beispiel, wie man analysiert wird Html :: Treebuilder:
use HTML::TreeBuilder;
my $html = HTML::TreeBuilder->new_from_content(<<END_HTML);
<a href="http://address.com">John</a>: I really <b>love</b> <b>soccer</b>;
END_HTML
my $name = $html->find('a')->as_text; # "John"
my @keywords = map { $_->as_text } $html->find('b'); # "love", "soccer"
my $comment = $html->as_text; # "John: I really love soccer; "
Aufräumen $comment
ist als Übung übrig.
Andere Tipps
Es gibt viele HTML -Parsers auf CPAN, mein bevorzugter ist Html :: Treebuilder :: XPath
Text :: CSV Sie hilft Ihnen, ein CSV aus den extrahierten Daten zu generieren.
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow