Python:codecsモジュールを使用するか、string関数decodeを使用しますか?
質問
UTF-8でエンコードされたテキストファイルがあります。私はいくつかのデータを分析してプロットするためにそれを読んでいます。ファイルをasciiで読み込むようにします。コーデックモジュールを使用するか、組み込みの文字列デコードメソッドを使用するのが最善でしょうか?また、ファイルはcsvとして分割されているので、csvモジュールも有効なソリューションになりますか?
ご協力ありがとうございます。
解決
ファイルがUTF-8でエンコードされているということですか? (<!> quot; Unicode <!> quot;はエンコードではありません...必読: http://www.joelonsoftware.com/articles/Unicode.html )100%確信はありませんが、csvモジュールでUTF-8でエンコードされたファイルを読むことができるはずです。読み取り後に特殊文字を含む文字列をPythonのUnicode文字列に変換します(必要に応じて edit:)。
http://docs.python.org./library/csv.html#csv-examples ;それらを見るのに役立つかもしれません。
所属していません StackOverflow