Code csharp pour supprimer tout formatage HTML inutile de Microsoft
Question
existe-t-il un moyen de supprimer par programmation tout le formatage HTML de Microsoft et de le restituer au format HTML normal?
Je veux supprimer toutes les balises supplémentaires car j'essaie de le charger dans tinymce mais tinymce ne semble pas pouvoir le rendre.
La solution
J'ai utilisé les expressions régulières de ces articles:
- http://tim.mackey.ie/CleanWordHTMLUsingRegularExpressions.aspx
- Comment filtrer toutes les balises HTML sauf une certaine liste blanche?
Dans mon cas, je voulais limiter tout le monde à une petite liste blanche de balises. Surtout ceux qui collent de Word. TinyMCE a une propriété " valid_elements " qui fait exactement cela.
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow