Pergunta

Eu tenho um arquivo de texto codificado no UTF-8. Estou lendo para analisar e plotar alguns dados. Eu gostaria que o arquivo fosse lido como ASCII. Seria melhor usar o módulo Codecs ou usar o método de decodificação de string incorporado? Além disso, o arquivo é dividido como um CSV, então o módulo CSV também poderia ser uma solução válida?

Obrigado pela ajuda.

Foi útil?

Solução

Você quer dizer que seu arquivo está codificado no UTF-8? ("Unicode" não é uma codificação ... leitura necessária: http://www.joelonsoftware.com/articles/unicode.html) Não tenho 100% de certeza, mas acho que você deve ser capaz de ler um arquivo codificado UTF-8 com o módulo CSV, e você pode converter as strings que contêm caracteres especiais em Strings Unicode do Python (editar: se você precisar) depois de ler.

Existem alguns exemplos de uso de CSV com dados codificados UTF-8 http://docs.python.org./library/csv.html#csv-examples; Pode ajudá -lo a olhar para eles.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top