SGML Parser .net Empfehlungen [geschlossen
Frage
In meinem C# -Projekt wurde ich mit der Aufgabe befasst, eine SGML-Datei zu analysieren und sehr naiv versucht zu haben, XMLReader zu verwenden, und dies hat zu einigen interessanten Enthüllungen geführt (dh der Unterschied zwischen SGML und gut geformtem XML usw. .))
Ich denke also, dass ich nur einen guten SGML -Parser brauche, der ihn in eine XML -Datei umwandelt und von dort aus gehe. Bei meiner Suche habe ich zwei SGML -Parser gefunden, die sich in mein C# -Projekt integrieren können:
- Msdn's Sgmlreader, und
- James Clarks sp SGML -Parser.
Irgendwelche anderen Empfehlungen?
Lösung
Anscheinend aktualisiert Sgmlreader hier:
Andere Tipps
HTML ist eine Implementierung von SGML. Wenn Sie HTML richtig analysieren möchten, benötigen Sie einen SGML -Parser. SGMLReader scheint diesen Bedürfnissen gut zu passen, und ich plane, es selbst zu verwenden. Ich würde vorschlagen, HTML Tidy zu verwenden. Es handelt sich um eine native Anwendung, aber NET -Bindungen für sie existieren. Wenn Sie einen vollständig verwalteten Code benötigen, ist der SGMLReader der richtige Weg.