Как остановить Htmltidy от преобразования Umlauts (например, в & uuml;)

StackOverflow https://stackoverflow.com/questions/2450465

  •  20-09-2019
  •  | 
  •  

Вопрос

Наш веб -сайт запускает ввод пользователя через HTMltidy, чтобы очистить его. Очевидно, при этом это также вызывает боль для наших международных подписчиков, преобразуя Umlauts. Есть ли возможность указать, чтобы HTMltidy не сделал этого?

Я пробовал персонаж со всеми возможными вариантами, но, кажется, ничего не работает.

Это было полезно?

Решение

Просто предоставьте выходное кодирование (входное кодирование является необязательным) в файле конфигурации:

input-encoding: win1252
output-encoding: latin1

Для обзора доступных кодировков посмотрите на Документация по кодированию вывода.

РЕДАКТИРОВАТЬ: Итак, вы используете .NET привязки. Анкет Это те же самые настройки:

Document d = new Document(new FileStream("in.html", FileMode.Open));

d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();

d.Save("out.html");

С правильными установленными кодировками вы получите правильный результат, без ü и тому подобное.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top