htmltidyがumlautsを変換するのを止める方法(例えばütoü)
-
20-09-2019 - |
質問
当社のWebサイトは、htmltidyを介してユーザーの入力を実行してクリーニングします。どうやらこれを行っている間、それはまた、Umlautsを変換することにより、国際的な加入者に痛みを引き起こします。これを行わないようにHTMLTIDYを指定するオプションはありますか?
すべての可能なオプションでキャラクターエンコードを試みましたが、何も機能していないようです。
解決
構成ファイルで出力エンコード(入力エンコードはオプション)を提供するだけです。
input-encoding: win1252
output-encoding: latin1
利用可能なエンコーディングの概要については、 出力エンコードドキュメント.
編集: したがって、あなたはを使用しています .NETバインディング. 。それはまったく同じ設定です:
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
正しいエンコーディングセットを使用すると、正しい結果が得られます。 ü
そして、同様。
所属していません StackOverflow