Frage

Wie kann ich richtig Dateien in Codierungen außer UTF-8 in Awk lesen?

Ich habe eine Datei in Hebrew / Windows-1255-Codierung. Ein einfaches {print $ 0} awk druckt solche Sachen. wie kann ich es richtig gelesen?

War es hilfreich?

Lösung

awk selbst hat keine Unterstützung für verschiedene Kodierungen Handhabung. Es wird das Gebietsschema in der Umgebung angegeben ehren, aber die beste Wahl ist, um die Eingabe in der richtigen Codierung umcodiert werden, bevor es weg zu awk übergeben.

-f ist das Format, das Sie von konvertieren möchten, ist -t das Zielformat und -c überspringt ungültigen Zeichen, die vorzeitig iconv Operation beenden. Natürlich wird --help mehr Details geben.

iconv -c -f cp1255 -t utf8 somefile | awk ...
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top