إزالة أحرف متعددة الفئران من ملف باستخدام SED
سؤال
أحتاج إلى إزالة جميع أحرف Multibyte من ملف ، لا أعرف ما هي ، لذا أحتاج إلى تغطية النطاق بأكمله.
يمكنني العثور عليها باستخدام GREP مثل SO: GREP -P [ x80- xff] 'myfile'
محاولة القيام بشيء محدد مع SED ، ولكن حذفها بدلاً من ذلك.
هتافات
المحلول
جرب هذا:
LANG=C sed 's/[\x80-\xFF]//g' filename
نصائح أخرى
يمكنك استخدام Iconv للتحويل من ترميز إلى آخر
لا تنتمي إلى StackOverflow