Python: Utilisez le module de codecs ou utilisez la fonction de chaîne de caractères décoder?

https://stackoverflow.com/questions/474373

19-08-2019
|

Question

J'ai un fichier texte encodé en UTF-8. Je le lis pour analyser et tracer des données. Je voudrais que le fichier soit lu en ascii. Serait-il préférable d'utiliser le module de codecs ou d'utiliser la méthode de décodage de chaîne intégrée? De plus, le fichier est divisé en csv. Le module csv pourrait-il également être une solution valable?

Merci de votre aide.

La solution

Voulez-vous dire que votre fichier est encodé en UTF-8? ("Unicode" n'est pas un codage ... Lecture obligatoire: http: //www.joelonsoftware .com / articles / Unicode.html ) Je ne suis pas sûr à 100% mais je pense que vous devriez être capable de lire un fichier encodé en UTF-8 avec le module CSV, et vous pouvez convertir les chaînes contenant des caractères spéciaux. sur les chaînes unicode de Python ( edit: si nécessaire) après lecture.

Il existe quelques exemples d'utilisation de csv avec des données codées UTF-8 à http://docs.python.org./library/csv.html#csv-examples ; cela pourrait vous aider de les regarder.

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow