如何阻止htmltidy转换umlauts(例如ü)
-
20-09-2019 - |
题
我们的网站通过HTMLTIDY运行用户的输入以清洁它。显然,在这样做时,这也会通过转换Umlauts给我们的国际订户造成痛苦。是否可以为HTMLTIDY指定任何选择不这样做?
我尝试使用所有可能的选项进行角色编码,但似乎没有任何作用。
解决方案
只需在配置文件中提供输出编码(输入编码是可选的):
input-encoding: win1252
output-encoding: latin1
有关可用编码的概述,请查看 输出编码文档.
编辑: 因此,您正在使用 .NET结合. 。这是相同的设置:
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
使用正确的编码设置,您将获得正确的结果,而无需 ü
等等。
不隶属于 StackOverflow