كيفية إيقاف HTMLTIDY من تحويل Umlauts (على سبيل المثال ü to & uuml؛)
-
20-09-2019 - |
سؤال
يدير موقع الويب الخاص بنا إدخال المستخدم عبر HTMLTIDY لتنظيفه. على ما يبدو أثناء القيام بذلك، يسبب ذلك أيضا ألم لمشتركينا الدوليين من خلال تحويل Umlauts. هل هناك أي خيار لتحديد HTMLTIDY لعدم القيام بذلك؟
حاولت fellingoding بكل الخيارات الممكنة ولكن لا شيء يبدو أنه يعمل.
المحلول
ما عليك سوى تقديم ترميز إخراج (ترميز الإدخال اختياري) في ملف التكوين:
input-encoding: win1252
output-encoding: latin1
للحصول على نظرة عامة على الترميزات المتاحة، انظر إلى وثائق ترميز الإخراج.
تعديل: لذلك أنت تستخدم .NET BINDINGS.. وبعد إنها نفس الإعدادات:
Document d = new Document(new FileStream("in.html", FileMode.Open));
d.InputCharacterEncoding = EncodingType.Utf8;
d.OutputCharacterEncoding = EncodingType.Win1252;
d.CleanAndRepair();
d.Save("out.html");
مع مجموعة الترميزات الصحيحة، سوف تحصل على النتيجة الصحيحة، دون ü
وما شابه ذلك.
لا تنتمي إلى StackOverflow