SGML raccomandazioni parser .NET [chiusa]
Domanda
Nel mio progetto C #, ho affrontato il compito di analizzare un file SGML e ho provato, molto ingenuamente, da utilizzare XmlReader, e questo ha portato ad alcune rivelazioni interessanti (ad esempio, la differenza tra SGML e ben formato XML, ecc.)
Così sto pensando che ho solo bisogno di un buon parser SGML, che lo converte in un file XML e passare da lì. Nella mia ricerca, ho trovato due parser SGML in grado di integrare con il mio progetto C #:
- SgmlReader , e
- SP di James Clark SGML parser .
Tutte le altre raccomandazioni?
Soluzione
A quanto pare di SgmlReader aggiornati qui:
Altri suggerimenti
HTML è un'implementazione di SGML. Se si vuole analizzare HTML correttamente, è necessario un parser SGML. SGMLreader sembra adattarsi bene tali esigenze, e ho intenzione di usarlo io stesso. Io suggerirei di usare HTML ordinato. Si tratta di un'applicazione nativa, ma esistono binding .net per esso. Se avete bisogno interamente gestito codice, quindi lo SGMLreader è la strada da percorrere.