Recomendações do analisador SGML .NET [fechado
Pergunta
No meu projeto C#, fui tratado com a tarefa de analisar um arquivo SGML e tentei, muito ingenuamente, usar o XMLReader, e isso levou a algumas revelações interessantes (ou seja, a diferença entre SGML e XML bem formado, etc. .)
Então, estou pensando que só preciso de um bom analisador SGML que o converte em um arquivo XML e vá a partir daí. Na minha pesquisa, encontrei dois analisadores SGML que podem se integrar ao meu projeto C#:
- MSDN's SGMLReader, e
- SP de James Clark Analisador sgml.
Alguma outra recomendação?
Solução
Aparentemente, o SGMLReader está atualizado aqui:
Outras dicas
HTML é uma implementação do SGML. Se você deseja analisar o HTML corretamente, precisará de um analisador SGML. O SGMLReader parece atender bem a essas necessidades, e pretendo usá -lo sozinho. Eu sugeriria usar o HTML Tidy. É uma aplicação nativa, mas as ligações .NET para ele existem. Se você precisar de código inteiramente gerenciado, o SGMLReader é o caminho a percorrer.