Comment empêcher htmltidy de convertir les umlauts (par exemple ü à & uuml;)
-
20-09-2019 - |
Question
Notre site Web exécute les contributions de l'utilisateur via HTMLTIDY pour le nettoyer. Apparemment, en faisant cela, cela provoque également des douleurs à nos abonnés internationaux en convertissant les umlauts. Y a-t-il une option à spécifier pour que HTMLtidy ne fasse pas cela?
J'ai essayé le caractérisation avec toutes les options possibles mais rien ne semble fonctionner.
La solution
Fournissez simplement un codage de sortie (le codage d'entrée est facultatif) dans le fichier de configuration:
input-encoding: win1252
output-encoding: latin1
Pour un aperçu des encodages disponibles, regardez le documentation de codage de sortie.
ÉDITER: Vous utilisez donc le .NET BESAUX. Ce sont les mêmes paramètres:
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
Avec l'ensemble d'encodages corrects, vous obtiendrez le résultat correct, sans ü
etc.