كيفية إيقاف HTMLTIDY من تحويل Umlauts (على سبيل المثال ü to & uuml؛)

StackOverflow https://stackoverflow.com/questions/2450465

  •  20-09-2019
  •  | 
  •  

سؤال

يدير موقع الويب الخاص بنا إدخال المستخدم عبر HTMLTIDY لتنظيفه. على ما يبدو أثناء القيام بذلك، يسبب ذلك أيضا ألم لمشتركينا الدوليين من خلال تحويل Umlauts. هل هناك أي خيار لتحديد HTMLTIDY لعدم القيام بذلك؟

حاولت fellingoding بكل الخيارات الممكنة ولكن لا شيء يبدو أنه يعمل.

هل كانت مفيدة؟

المحلول

ما عليك سوى تقديم ترميز إخراج (ترميز الإدخال اختياري) في ملف التكوين:

input-encoding: win1252
output-encoding: latin1

للحصول على نظرة عامة على الترميزات المتاحة، انظر إلى وثائق ترميز الإخراج.

تعديل: لذلك أنت تستخدم .NET BINDINGS.. وبعد إنها نفس الإعدادات:

Document d = new Document(new FileStream("in.html", FileMode.Open));

d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();

d.Save("out.html");

مع مجموعة الترميزات الصحيحة، سوف تحصل على النتيجة الصحيحة، دون ü وما شابه ذلك.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top