كيفية قراءة الملفات مع ترميزات مختلفة باستخدام AWK؟

StackOverflow https://stackoverflow.com/questions/1820659

  •  10-07-2019
  •  | 
  •  

سؤال

كيف يمكنني بشكل صحيح قراءة الملفات في ترميزات أخرى غير UTF8 في AWK؟

ولدي ملف في ترميز العبرية / ويندوز-1255. بسيطة {طباعة $ 0} يطبع AWK الاشياء مثل. كيف يمكنني جعل قراءتها بشكل صحيح؟

هل كانت مفيدة؟

المحلول

وAWK نفسها ليس لديها أي دعم للتعامل مع ترميزات مختلفة. وسوف يكرم اللغة المحددة في البيئة، ولكن أفضل رهان هو فيرت مساهمة في الترميز المناسب قبل تسليم تشغيله لAWK.

و-f هو التنسيق الذي تريد تحويله، -t هو شكل الهدف، ويتخطى -c على أي أحرف غير صالحة التي تنتهي قبل الأوان عملية يكونف ل. بالطبع --help واعطاء المزيد من التفاصيل.

iconv -c -f cp1255 -t utf8 somefile | awk ...
مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top