كم عدد الأحرف غير القابلة للطباعة في شائعة الاستخدام ؟

StackOverflow https://stackoverflow.com/questions/1627481

  •  06-07-2019
  •  | 
  •  

سؤال

عند كتابة المترجمين PDF, HTML وغيرها من الوثائق نحن بحاجة إلى التعامل مع مجموعة متنوعة من white-space شخصيات إضافية الأحرف غير القابلة للطباعة.ANSI هي محددة تحديدا جيدا ، ولكن كيف العديد من الآخرين من المرجح أن تكون وجدت في الممارسة العملية ؟ والمثال النموذجي هو الكتلة في ISO10646 (أعتقد):

                     en space
                 em space
                   thin space
‌  ‌     ‌   ‌   zero width non-joiner
‍   ‍     ‍   ‍   zero width joiner
‎   ‎     ‎   ‎   left-to-right mark
‏   ‏     ‏   ‏   right-to-left mark

(لأسباب واضحة لا تظهر الأحرف أعلاه!).

هل كانت مفيدة؟

المحلول

ويونيكود سيكون معنا، في زيادة كمية، لفترة طويلة. إذا هو مكتوب وثيقة HTML أو XML في UTF-8 ترميز يونيكود، ثم يجب أن تتوقع أي وجميع هذه على ما يبدو.

في يونيكود (يونيكود الأحرف قاعدة بيانات) يتم تحديد codepoints التالية كما بيضاء:

U+0009–U+000D (control characters, containing Tab, CR and LF)
U+0020 SPACE
U+0085 NEL (control character next line)
U+00A0 NBSP (NO-BREAK SPACE)
U+1680 OGHAM SPACE MARK
U+180E MONGOLIAN VOWEL SEPARATOR
U+2000–U+200A (different sorts of spaces)
U+2028 LS (LINE SEPARATOR)
U+2029 PS (PARAGRAPH SEPARATOR)
U+202F NNBSP (NARROW NO-BREAK SPACE)
U+205F MMSP (MEDIUM MATHEMATICAL SPACE)
U+3000 IDEOGRAPHIC SPACE

نصائح أخرى

في عالم التنمية هناك واحد على الأقل أكثر (غالبا ما تستخدم في تطوير مواقع)

   // non-breaking space

ولكن أكثر تحصل على تصميم العالم أكثر يمكنك أن ترى مختلف المساحة/غير مرئية الأحرف.نشر البرمجيات عادة

  • الفضاء - الفضاء العادية
  • ar الفضاء
  • م الفضاء
  • رقيقة الفضاء
  • الشعر الفضاء
  • غير كسر الفضاء
  • غير كسر عرض ثابت الفضاء
  • السادسة الفضاء
  • الربع الفضاء
  • الفضاء الثالث
  • علامات الترقيم الفضاء
  • مسح الفضاء
  • الرقم الفضاء
  • ...
مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top