HTML mit Perl analysieren

https://stackoverflow.com/questions/7319756

27-10-2019
|

Frage

Ich habe das folgende html-

<a href="http://address.com">John</a>: I really <b>love</b> <b>soccer</b>;

Ich möchte es in ein CSV analysieren, wo ich hätte

Name = John

Kommentar = Ich liebe Fußball wirklich.

Schlüsselwörter = Liebe, Fußball

In der Konsolen -App wird jede Hilfe sehr geschätzt.

Lösung

Hier ist ein Beispiel, wie man analysiert wird Html :: Treebuilder:

use HTML::TreeBuilder;

my $html = HTML::TreeBuilder->new_from_content(<<END_HTML);
<a href="http://address.com">John</a>: I really <b>love</b> <b>soccer</b>;
END_HTML

my $name     = $html->find('a')->as_text;               # "John"
my @keywords = map { $_->as_text } $html->find('b');    # "love", "soccer"
my $comment  = $html->as_text;                          # "John: I really love soccer; "

Aufräumen $comment ist als Übung übrig.

Andere Tipps

Es gibt viele HTML -Parsers auf CPAN, mein bevorzugter ist Html :: Treebuilder :: XPath

Text :: CSV Sie hilft Ihnen, ein CSV aus den extrahierten Daten zu generieren.

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow