Pergunta

No meu projeto C#, fui tratado com a tarefa de analisar um arquivo SGML e tentei, muito ingenuamente, usar o XMLReader, e isso levou a algumas revelações interessantes (ou seja, a diferença entre SGML e XML bem formado, etc. .)

Então, estou pensando que só preciso de um bom analisador SGML que o converte em um arquivo XML e vá a partir daí. Na minha pesquisa, encontrei dois analisadores SGML que podem se integrar ao meu projeto C#:

Alguma outra recomendação?

Foi útil?

Solução

Aparentemente, o SGMLReader está atualizado aqui:

https://github.com/mindtouch/sgmlreader

Outras dicas

HTML é uma implementação do SGML. Se você deseja analisar o HTML corretamente, precisará de um analisador SGML. O SGMLReader parece atender bem a essas necessidades, e pretendo usá -lo sozinho. Eu sugeriria usar o HTML Tidy. É uma aplicação nativa, mas as ligações .NET para ele existem. Se você precisar de código inteiramente gerenciado, o SGMLReader é o caminho a percorrer.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top