Python:codecsモジュールを使用するか、string関数decodeを使用しますか?

StackOverflow https://stackoverflow.com/questions/474373

質問

UTF-8でエンコードされたテキストファイルがあります。私はいくつかのデータを分析してプロットするためにそれを読んでいます。ファイルをasciiで読み込むようにします。コーデックモジュールを使用するか、組み込みの文字列デコードメソッドを使用するのが最善でしょうか?また、ファイルはcsvとして分割されているので、csvモジュールも有効なソリューションになりますか?

ご協力ありがとうございます。

役に立ちましたか?

解決

ファイルがUTF-8でエンコードされているということですか? (<!> quot; Unicode <!> quot;はエンコードではありません...必読: http://www.joelonsoftware.com/articles/Unicode.html )100%確信はありませんが、csvモジュールでUTF-8でエンコードされたファイルを読むことができるはずです。読み取り後に特殊文字を含む文字列をPythonのUnicode文字列に変換します(必要に応じて edit:)。

http://docs.python.org./library/csv.html#csv-examples ;それらを見るのに役立つかもしれません。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top