Как остановить Htmltidy от преобразования Umlauts (например, в & uuml;)
-
20-09-2019 - |
Вопрос
Наш веб -сайт запускает ввод пользователя через HTMltidy, чтобы очистить его. Очевидно, при этом это также вызывает боль для наших международных подписчиков, преобразуя Umlauts. Есть ли возможность указать, чтобы HTMltidy не сделал этого?
Я пробовал персонаж со всеми возможными вариантами, но, кажется, ничего не работает.
Решение
Просто предоставьте выходное кодирование (входное кодирование является необязательным) в файле конфигурации:
input-encoding: win1252
output-encoding: latin1
Для обзора доступных кодировков посмотрите на Документация по кодированию вывода.
РЕДАКТИРОВАТЬ: Итак, вы используете .NET привязки. Анкет Это те же самые настройки:
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
С правильными установленными кодировками вы получите правильный результат, без ü
и тому подобное.
Не связан с StackOverflow