我们的网站通过HTMLTIDY运行用户的输入以清洁它。显然,在这样做时,这也会通过转换Umlauts给我们的国际订户造成痛苦。是否可以为HTMLTIDY指定任何选择不这样做?

我尝试使用所有可能的选项进行角色编码,但似乎没有任何作用。

有帮助吗?

解决方案

只需在配置文件中提供输出编码(输入编码是可选的):

input-encoding: win1252
output-encoding: latin1

有关可用编码的概述,请查看 输出编码文档.

编辑: 因此,您正在使用 .NET结合. 。这是相同的设置:

Document d = new Document(new FileStream("in.html", FileMode.Open));

d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();

d.Save("out.html");

使用正确的编码设置,您将获得正确的结果,而无需 ü 等等。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top