HTML Agility Pack - Wählen Sie Knoten nach bestimmten Knoten
-
19-09-2019 - |
Frage
, fragte ich die Frage in einem codeplex Diskussion aber ich Hoffnung Antwort ein schnelle hier bei Stackoverflow zu erhalten.
So verwende ich HTML Agility-Pack für HTML-Analyse in C #. Ich habe die folgende HTML-Struktur:
<body>
<p class="paragraph">text</p>
<p class="paragraph">text</p>
<p class="specific">text</p>
<p class="paragraph">text</p>
<p class="paragraph">text</p>
</body>
Und ich brauche alle p-Elemente mit Klasse „Absatz“ zu erhalten, die mit Klasse „spezifischen“ nach dem p-Elemente vorhanden sein.
Gibt es eine Möglichkeit, das zu tun?
Danke.
Lösung
mit .class- wie in Mark Beispiel (wenn das tut exist, Ersatz, was geeignet ist)
Verwenden Sie Skipwhile
z. in LINQPad erhalten Sie 5,6,7
aus:
int[] a = { 6, 5, 6 ,7 };
a.SkipWhile(x=>x!=6).Skip(1).Dump();
So, je nach Typ Zu, entweder:
.SelectNodes( "/p" ).SkipWhile( p => p.Class != "specific" ).Skip(1)
oder
.SelectNodes( "/p" ).Cast<XX>().SkipWhile( p => p.Class != "specific" ).Skip(1)
(oder, hässliche Version)
.SelectNodes( "/p" ).SkipWhile( p => ((XX)p).Class != "specific" ).Skip(1)
(oder in einigen Fällen - nicht, wenn Ihr Ausdruck bereits filtert entsprechend)
.SelectNodes( "/p" ).OfType<XX>().SkipWhile( p => p.Class != "specific" ).Skip(1)
EDIT: Ich würde wahrscheinlich eine Erweiterungsmethode erstellen:
static class HapExtensions
{
public IEnumerable<T> SkipUntilAfter( this IEnumerable<T> sequence, Predicate<T> predicate) {
return sequence.SkipWhile( predicate).Skip(1);
}
}
Jede Pflege Stand der Technik für diesen sucht nach oben? Irgendwelche guten Namen Vorschläge?
Andere Tipps
Versuchen Sie diese
bool latterDayParagraphs = false;
List<DocumentNode> nodes = new List<DocumentNode>();
foreach(var pElement in doc.DocumentNode.SelectNodes("/p"))
{
if(pElement.Class != "paragraph")
{
latterDayParagraphs = true;
continue;
}
if(latterDayParagraphs)
{
nodes.Add(pElement);
}
}