OSX, G/AWK, BASH - "Dichiarazione illegale, stringa non terminata" e nessun output di file
Domanda
Ho una sceneggiatura che qualcuno di così gentile ha fornito per risolvere un problema che stavo avendo, tuttavia, ho alcuni problemi a farlo lavorare su OSX.
gawk --version
GNU Awk 3.1.6
awk --version
awk version 20100208
La fonte originale è:
awk -F, -vOFS=, -vc=1 '
NR == 1 {
for (i=1; i<NF; i++) {
if ($i != "") {
g[c]=i;
f[c++]=$i
}
}
}
NR>2 {
for (i=1; i < c; i++) {
print $1,$2, $g[i] > "output_"f[i]".csv
}
}' data.csv
Quando eseguo lo script fornisce il seguente errore:
awk: syntax error at source line 12
context is print $1,$2, $g[i] > >>> "output_"f <<< [i]".csv
awk: illegal statement at source line 13
Dall'aspetto di esso la variabile di [i] non è stata modificata nel file di output, ma non so perché.
Se cambio awk a Gawk ed eseguo lo script originale ecco l'output:
gawk: cmd. line:11: print $1,$2, $g[i] > "output_"f[i]".csv
gawk: cmd. line:11: ^ unterminated string
Quindi modifico la riga pertinente per correggere la stringa non terminata
print $1,$2, $g[i] > "output_"f[i]".csv"
Quindi funziona attraverso Fine non produce errori, ma non ci sono file di output.
Qualche idea? Ho trascorso la maggior parte della scorsa notte e questa mattina mi sono riversato su questo.
Un file di input di esempio:
,,L1,,,L2,,,L3,,,L4,,,L5,,,L6,,,L7,,,L8,,,L9,,,L10,,,L11,
Title,r/t,needed,actual,Inst,needed,actual,Inst,needed,actual,Inst,needed,actual,Inst,neede d,actual,Inst,needed,actual,Inst,needed,actual,Inst,needed,actual,Inst,needed,actual,Inst,needed,actual,Inst,needed,actual,Inst
EXAMPLEfoo,60,6,6,6,0,0,0,0,0,0,6,6,6,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
EXAMPLEbar,30,6,6,12,6,7,14,6,6,12,6,6,12,6,8,16,6,7,14,6,7.5,15,6,6,12,6,8,16,6,0,0,6,7,14
EXAMPLE1,60,3,3,3,3,5,5,3,4,4,3,3,3,3,6,6,3,4,4,3,3,3,3,4,4,3,8,8,3,0,0,3,4,4
EXAMPLE2,120,6,6,3,0,0,0,6,8,4,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
EXAMPLE3,60,6,6,6,6,8,8,6,6,6,6,6,6,0,0,0,0,0,0,6,8,8,6,6,6,0,0,0,0,0,0,0,10,10
EXAMPLE4,30,6,6,12,6,7,14,6,6,12,6,6,12,3,5.5,11,6,7.5,15,6,6,12,6,0,0,6,9,18,6,0,0,6,6.5,13
E l'esempio out put dovrebbe essere
Quindi per L1 un esempio out un aspetto sarebbe:
EXAMPLEfoo,60,6
EXAMPLEbar,30,6
EXAMPLE1,60,3
EXAMPLE2,120,6
EXAMPLE3,60,6
EXAMPLE4,30,6
E per L2:
EXAMPLEfoo,60,0
EXAMPLEbar,30,6
EXAMPLE1,60,3
EXAMPLE2,120,0
EXAMPLE3,60,6
EXAMPLE4,30,6
Soluzione
Vedo due problemi (sulla piattaforma OS X):
- Il comando AWK su OS X non supporta il flag -v. Possiamo risolverlo usando il modello iniziale.
- L'OS X AWK non piace il modo in cui il file di output costruito nella riga di stampa.
Ecco la mia soluzione, che sembra funzionare sia su Mac OS X Snow Leopard e Red Hat Linux 4.x:
awk -F, '
BEGIN { OFS=","; c=1 } # FIX problem 1
NR == 1 {
for (i=1; i<NF; i++) {
if ($i != "") {
g[c]=i;
f[c++]=$i
}
}
}
NR>2 {
for (i=1; i < c; i++) {
outfile=sprintf("output_%s.csv", f[i]) # FIX problem 2
print $1,$2, $g[i] > outfile
}
}' data.csv