سؤال

أقوم حاليًا بإنشاء برنامج يكون فيه إحدى وظائفه هو استخراج جزء HTML من بريد إلكتروني متعددًا.

لقد أنجزت هذه المهمة بشكل جيد ولكن هناك نوع من الترميز على بعض الأحرف التي لا يمكنني اكتشافها على سبيل المثال

',' into '=2C'
';' into '=3B'
'=' into '=3D'

كما أنه يضع عشوائيًا "=" في كل مكان.

هل يعرف أي شخص ما إذا كان هناك فك ترميز لهذا (أو حتى ما هو اسمه)؟ لقد استبدلت بعض الأشياء بالكود ، ومع ذلك ، فمن المحتمل أن يكون هناك الكثير الذي أفتقده لأنني لم أصادفها بعد. وبالتالي ، أود إما معرفة نوع الترميز حتى أتمكن من استبدال كل شيء ، أو العثور على مكتبة قامت بذلك بالفعل.

ملاحظة: سأرسل البريد الإلكتروني من حساب Hotmail ، إذا كان هذا هو السبب.

هل كانت مفيدة؟

المحلول

هذا يسمي مقتبسة-طباعة التشفير.

لسوء الحظ ، فإن QuotedPrintablestream الموجود من Microsoft داخلي بحيث لا يمكنك استخدامه. ومع ذلك ، يمكنك أن تأخذ أحد مشروع Mono ، أو أي مكتبة تتعامل مع معالجة MIME.

نصائح أخرى

يتم نقله عن ترميز قابل للطباعة ، ويتم شرحه في هذا RFC. اسمحوا لي أن أحذرك قبل أن تقضي الكثير من الوقت في مهمتك. يمكن أن يتحول تحليل رسائل البريد الإلكتروني إلى صداع حقيقي ، لذلك يجب ألا تفعل ذلك بنفسك. جرب هذه المكتبة المجانية ، إنها أفضل ما رأيته على الإطلاق (ورأيت الكثير منها) http://www.lumisoft.ee/lswww/download/downloads/net/

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top