Frage

In meinem C# -Projekt wurde ich mit der Aufgabe befasst, eine SGML-Datei zu analysieren und sehr naiv versucht zu haben, XMLReader zu verwenden, und dies hat zu einigen interessanten Enthüllungen geführt (dh der Unterschied zwischen SGML und gut geformtem XML usw. .))

Ich denke also, dass ich nur einen guten SGML -Parser brauche, der ihn in eine XML -Datei umwandelt und von dort aus gehe. Bei meiner Suche habe ich zwei SGML -Parser gefunden, die sich in mein C# -Projekt integrieren können:

Irgendwelche anderen Empfehlungen?

War es hilfreich?

Lösung

Anscheinend aktualisiert Sgmlreader hier:

https://github.com/mindtouch/sgmlreader

Andere Tipps

HTML ist eine Implementierung von SGML. Wenn Sie HTML richtig analysieren möchten, benötigen Sie einen SGML -Parser. SGMLReader scheint diesen Bedürfnissen gut zu passen, und ich plane, es selbst zu verwenden. Ich würde vorschlagen, HTML Tidy zu verwenden. Es handelt sich um eine native Anwendung, aber NET -Bindungen für sie existieren. Wenn Sie einen vollständig verwalteten Code benötigen, ist der SGMLReader der richtige Weg.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top