Come trasporre un set di dati in un file CSV?
Domanda
Ad esempio, vorrei trasformare:
Name,Time,Score
Dan,68,20
Suse,42,40
Tracy,50,38
In:
Name,Dan,Suse,Tracy
Time,68,42,50
Score,20,40,38
EDIT: la domanda originale ha utilizzato il termine "trasponi" in modo errato.
Soluzione
Se l'intero contenuto del file si adatta alla memoria, è possibile utilizzare
import csv
from itertools import izip
a = izip(*csv.reader(open("input.csv", "rb")))
csv.writer(open("output.csv", "wb")).writerows(a)
Fondamentalmente puoi pensare zip()
e izip()
Come operazioni di trasposizione:
a = [(1, 2, 3),
(4, 5, 6),
(7, 8, 9)]
zip(*a)
# [(1, 4, 7),
# (2, 5, 8),
# (3, 6, 9)]
izip()
Evita la copia immediata dei dati, ma sostanzialmente farà lo stesso.
Altri suggerimenti
Trasferito da input.csv
a output.csv
. I panda possono anche aiutare.
import pandas as pd
pd.read_csv('input.csv', header=None).T.to_csv('output.csv', header=False, index=False)
from itertools import izip
from csv import reader, writer
with open('source.csv') as f, open('destination.csv', 'w') as fw:
writer(fw, delimiter=',').writerows(izip(*reader(f, delimiter=',')))
Se lines
è l'elenco del tuo testo originale di quanto dovrebbe essere
for i in range(1,len(lines)):
lines[i] = lines[i].split(',')
new_lines = []
for i in range(len(lines[0])):
new_lines.append("%s,%s,%s" % (lines[0][i], lines[1][i], lines[2][i]))
o usare csv
Modulo Python - http://docs.python.org/library/csv.html
Stessa risposta di Nosklo (tutti i crediti per lui), ma per Python3:
from csv import reader, writer
with open('source.csv') as f, open('destination.csv', 'w') as fw:
writer(fw, delimiter=',').writerows(zip(*reader(f, delimiter=',')))
Il modo più semplice è:
import numpy as np
import pandas as pd
_mat = pd.read_csv("test.csv")
_mat = _mat[_mat.columns[0:3]].values
_t_mat = np.transpose(_mat)
Risultato:
- La matrice di input è: [[1 2 3] [4 5 6]
- L'output è: [[1 4] [2 5] [3 6]
Leggi il CSV in pandas
Frame di dati, Pandas ha una funzione in funzione per la trasposizione che può essere invocata come di seguito.
import pandas as pd
csv = pd.read_csv("test.csv", skiprows=1)
# use skiprows if you want to skip headers
df_csv = pd.DataFrame(data=csv)
transposed_csv = df_csv.T
print(transposed_csv)