Pregunta

Tengo un archivo de texto que está codificado en UTF-8. Lo estoy leyendo para analizar y trazar algunos datos. Me gustaría que el archivo se lea como ascii. ¿Sería mejor usar el módulo de códecs o usar el método de decodificación de cadenas incorporado? Además, el archivo está dividido como un csv, entonces ¿podría el módulo csv también ser una solución válida?

Gracias por su ayuda.

¿Fue útil?

Solución

¿Quiere decir que su archivo está codificado en UTF-8? (" Unicode " no es una codificación ... Lectura obligatoria: http: //www.joelonsoftware .com / articles / Unicode.html ) No estoy 100% seguro, pero creo que debería poder leer un archivo codificado UTF-8 con el módulo csv, y puede convertir las cadenas que contienen caracteres especiales a las cadenas unicode de Python ( editar: si es necesario) después de leer.

Hay algunos ejemplos de uso de csv con datos codificados UTF-8 en http://docs.python.org./library/csv.html#csv-examples ; podría ayudarte a mirarlos.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top