Comment empêcher htmltidy de convertir les umlauts (par exemple ü à & uuml;)

StackOverflow https://stackoverflow.com/questions/2450465

  •  20-09-2019
  •  | 
  •  

Question

Notre site Web exécute les contributions de l'utilisateur via HTMLTIDY pour le nettoyer. Apparemment, en faisant cela, cela provoque également des douleurs à nos abonnés internationaux en convertissant les umlauts. Y a-t-il une option à spécifier pour que HTMLtidy ne fasse pas cela?

J'ai essayé le caractérisation avec toutes les options possibles mais rien ne semble fonctionner.

Était-ce utile?

La solution

Fournissez simplement un codage de sortie (le codage d'entrée est facultatif) dans le fichier de configuration:

input-encoding: win1252
output-encoding: latin1

Pour un aperçu des encodages disponibles, regardez le documentation de codage de sortie.

ÉDITER: Vous utilisez donc le .NET BESAUX. Ce sont les mêmes paramètres:

Document d = new Document(new FileStream("in.html", FileMode.Open));

d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();

d.Save("out.html");

Avec l'ensemble d'encodages corrects, vous obtiendrez le résultat correct, sans ü etc.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top