Удаление мультибитных символов из файла с использованием SED
Вопрос
Мне нужно удалить все мультибитные символы из файла, я не знаю, что они есть, поэтому мне нужно покрыть весь диапазон.
Я могу найти их, используя grep, как так: grep -p [ x80- xff] 'myfile'
Попытка сделать симулярную вещь с SED, но вместо этого удалить их.
Ваше здоровье
Решение
Give this a try:
LANG=C sed 's/[\x80-\xFF]//g' filename
Другие советы
you can use iconv to convert from one encoding to another
Не связан с StackOverflow