Domanda

Nel mio progetto C #, ho affrontato il compito di analizzare un file SGML e ho provato, molto ingenuamente, da utilizzare XmlReader, e questo ha portato ad alcune rivelazioni interessanti (ad esempio, la differenza tra SGML e ben formato XML, ecc.)

Così sto pensando che ho solo bisogno di un buon parser SGML, che lo converte in un file XML e passare da lì. Nella mia ricerca, ho trovato due parser SGML in grado di integrare con il mio progetto C #:

Tutte le altre raccomandazioni?

È stato utile?

Soluzione

A quanto pare di SgmlReader aggiornati qui:

https://github.com/MindTouch/SGMLReader

Altri suggerimenti

HTML è un'implementazione di SGML. Se si vuole analizzare HTML correttamente, è necessario un parser SGML. SGMLreader sembra adattarsi bene tali esigenze, e ho intenzione di usarlo io stesso. Io suggerirei di usare HTML ordinato. Si tratta di un'applicazione nativa, ma esistono binding .net per esso. Se avete bisogno interamente gestito codice, quindi lo SGMLreader è la strada da percorrere.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top