سؤال

وقبل أي شخص يوصي بأن أقوم بعملية بحث جوجل على هذا، لدي. أنا فقط بحاجة إلى مزيد من الوضوح قليلا حول ما مخططات شفرة وترميزات.

إذا كنت تستخدم ترميز UTF8، واستخدام الشفرة الايطالية وبعد ذلك صفحة الرموز الفرنسية، هل هذا يعني سوء الحصول على شخصيات مختلفة على الرغم من أن بايت طعاما تغيرت؟

هل كانت مفيدة؟

المحلول

وجويل لديه ملخص لطيفة من هذا:
http://www.joelonsoftware.com/articles/Unicode.html

ولا. إذا فهمت سؤالك بشكل صحيح وهذا لا يعني أن. وعند الانتهاء من تحويل UTF-8 إلى صفحة رموز معينة، فمن الممكن أن فقط بعض الشخصيات سوف يتم تحويلها. ماذا يحدث لتلك التي لا تحصل على تحويلها يعتمد على كيفية استدعاء التحويل. ونتيجة ممكنة هي أن الشخصيات التي لا يمكن تعيينها إلى صفحة الرموز سيتم تحويلها إلى السؤال أحرف علامة.

نصائح أخرى

وهناك ترميز هو مجرد تعيين بين القيم العددية و"أحرف".

وخرائط US-ASCII عدد 65 إلى بريد إلكتروني A، 32 إلى الفضاء و49 إلى الرقم "1". (كيف يتم تقديم هذه الأمور هو مسألة أخرى). في الواقع، UTF-8 يفعل نفس الشيء! ولكن هناك قيم أخرى التي يعامل بشكل مختلف لASCII 8 UTF. وهو ترميز متغير طول، أي يمكن ترميز شخصية مع 1، 2، 3، أو 4 بايت. الأحرف الشائعة تستهلك عادة أقل بايت.

وملفات نصية عادي، بما في ذلك صفحات الويب، ويتم تخزين ونقلها حسب تسلسل بايت. ومن المفترض أن هذه بايت لتمثيل شيء النصية. تطبيقات البرمجيات (مثل برامج تحرير النصوص ومتصفحات الويب) هي المسؤولة عن تدمى المعلومات ضمن هذه الملفات على الشاشة. وعادة ما الاستفادة من المكتبة أو OS الوظائف.

وإذا كان البرنامج يفترض ترميز مختلفة إلى البرنامج الذي أنشأ الملف، قد يتم عرض الأحرف غير صحيح!

لاحظ أنه من الممكن تحويل بين ترميزات مختلفة. ولكن إذا كنت تحويله إلى الترميز الذي لا يحتوي على حرف معينة، يجب أن البرنامج جعل خيار لماذا تستخدم بدلا من ذلك. هذا التحويل غالبا ما يحدث بشفافية (عند حفظ الملف مع ترميز معين، كل ما كنت قد كتبته يجب أن تتغير في ذلك الترميز).

يتضمن

وUTF-8 كافة الأحرف من صفحة الرموز الفرنسية والإيطالية، ولكن لغة معينة صفحات الرموز لا تشمل جميع من كل شخصيات اخرى.

وهكذا يمكنك أن تأخذ المدخلات من كل لغة وتحويله إلى UTF-8 للتخزين، ولكن لا يمكنك أن تكون متأكدا من أنك سوف تحصل على الأحرف الصحيحة إذا كنت تأخذ المدخلات الإيطالي وتبين أنها الفرنسية.

استخدم UTF-8 على طول الطريق إذا كنت تستطيع.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top