Python: استخدم وحدة الترميز أو استخدام وحدة فك تشفير وظيفة السلسلة؟

StackOverflow https://stackoverflow.com/questions/474373

سؤال

لدي ملف نصي مشفر في UTF-8. أنا أقرأها لتحليل بعض البيانات ورسمها. أود قراءة الملف باسم ASCII. هل سيكون من الأفضل استخدام وحدة الترميز أو استخدام طريقة فك تشفير السلسلة المدمجة؟ أيضًا ، يتم تقسيم الملف إلى CSV ، وكذلك يمكن أن تكون وحدة CSV أيضًا حلًا صالحًا؟

شكرا لمساعدتك.

هل كانت مفيدة؟

المحلول

هل تقصد أن ملفك مشفر في UTF-8؟ ("Unicode" ليس ترميزًا ... القراءة المطلوبة: http://www.joelonsoftware.com/articles/unicode.html) لست متأكدًا بنسبة 100 ٪ ، لكنني أعتقد أنك يجب أن تكون قادرًا على قراءة ملف مشفر UTF-8 مع وحدة CSV ، ويمكنك تحويل السلاسل التي تحتوي على أحرف خاصة إلى سلاسل Python Unicode (تعديل: إذا كنت بحاجة إلى) بعد القراءة.

هناك بعض الأمثلة على استخدام CSV مع بيانات مشفرة UTF-8 على http://docs.python.org./library/csv.html#csv-examples; ؛ قد يساعدك ذلك على النظر إليهم.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top