Entfernen Sie Multibyte -Zeichen aus einer Datei mit SED
Frage
Ich muss alle Multibyte -Zeichen aus einer Datei entfernen, ich weiß nicht, was sie sind, also muss ich den gesamten Bereich abdecken.
Ich kann sie mit Grep wie SO finden: grep -p [ x80- xff] 'myfile' '
Ich versuche, mit SED etwas gleichmäßig zu machen, aber sie lösche sie stattdessen.
Prost
Lösung
Probieren Sie es aus:
LANG=C sed 's/[\x80-\xFF]//g' filename
Andere Tipps
Sie können verwenden Ikonv von einer Kodierung in einen anderen konvertieren
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow