كم عدد الأحرف غير القابلة للطباعة في شائعة الاستخدام ؟
-
06-07-2019 - |
سؤال
عند كتابة المترجمين PDF, HTML وغيرها من الوثائق نحن بحاجة إلى التعامل مع مجموعة متنوعة من white-space شخصيات إضافية الأحرف غير القابلة للطباعة.ANSI هي محددة تحديدا جيدا ، ولكن كيف العديد من الآخرين من المرجح أن تكون وجدت في الممارسة العملية ؟ والمثال النموذجي هو الكتلة في ISO10646 (أعتقد):
    en space
    em space
    thin space
‌ ‌ zero width non-joiner
‍ ‍ zero width joiner
‎ ‎ left-to-right mark
‏ ‏ right-to-left mark
(لأسباب واضحة لا تظهر الأحرف أعلاه!).
المحلول
ويونيكود سيكون معنا، في زيادة كمية، لفترة طويلة. إذا هو مكتوب وثيقة HTML أو XML في UTF-8 ترميز يونيكود، ثم يجب أن تتوقع أي وجميع هذه على ما يبدو.
في يونيكود (يونيكود الأحرف قاعدة بيانات) يتم تحديد codepoints التالية كما بيضاء:
U+0009–U+000D (control characters, containing Tab, CR and LF)
U+0020 SPACE
U+0085 NEL (control character next line)
U+00A0 NBSP (NO-BREAK SPACE)
U+1680 OGHAM SPACE MARK
U+180E MONGOLIAN VOWEL SEPARATOR
U+2000–U+200A (different sorts of spaces)
U+2028 LS (LINE SEPARATOR)
U+2029 PS (PARAGRAPH SEPARATOR)
U+202F NNBSP (NARROW NO-BREAK SPACE)
U+205F MMSP (MEDIUM MATHEMATICAL SPACE)
U+3000 IDEOGRAPHIC SPACE
نصائح أخرى
في عالم التنمية هناك واحد على الأقل أكثر (غالبا ما تستخدم في تطوير مواقع)
// non-breaking space
ولكن أكثر تحصل على تصميم العالم أكثر يمكنك أن ترى مختلف المساحة/غير مرئية الأحرف.نشر البرمجيات عادة
- الفضاء - الفضاء العادية
- ar الفضاء
- م الفضاء
- رقيقة الفضاء
- الشعر الفضاء
- غير كسر الفضاء
- غير كسر عرض ثابت الفضاء
- السادسة الفضاء
- الربع الفضاء
- الفضاء الثالث
- علامات الترقيم الفضاء
- مسح الفضاء
- الرقم الفضاء
- ...