htmltidyがumlautsを変換するのを止める方法(例えばütoü)

StackOverflow https://stackoverflow.com/questions/2450465

  •  20-09-2019
  •  | 
  •  

質問

当社のWebサイトは、htmltidyを介してユーザーの入力を実行してクリーニングします。どうやらこれを行っている間、それはまた、Umlautsを変換することにより、国際的な加入者に痛みを引き起こします。これを行わないようにHTMLTIDYを指定するオプションはありますか?

すべての可能なオプションでキャラクターエンコードを試みましたが、何も機能していないようです。

役に立ちましたか?

解決

構成ファイルで出力エンコード(入力エンコードはオプション)を提供するだけです。

input-encoding: win1252
output-encoding: latin1

利用可能なエンコーディングの概要については、 出力エンコードドキュメント.

編集: したがって、あなたはを使用しています .NETバインディング. 。それはまったく同じ設定です:

Document d = new Document(new FileStream("in.html", FileMode.Open));

d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();

d.Save("out.html");

正しいエンコーディングセットを使用すると、正しい結果が得られます。 ü そして、同様。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top