سؤال

إذا قمت بإنشاء مكشطة على شبكة الإنترنت بسيطة (من عنوان URL للجذر، فاستطع جميع الروابط، ثم من تلك الروابط الاستيلاء على جميع رسائل البريد الإلكتروني) هل ستكون من المفيد استخدام حزمة أكلية أتش تي أم أل؟ أنا لا أبحث فعلا من خلال علامات HTML، أنا ببساطة أتطلع للمسح الضوئي لإرسال رسائل البريد الإلكتروني داخل المستند بأكمله.

هل سيكون أكثر كفاءة استخدام حزمة أجيليتي HTML؟

أنا تجريدهم بدقة لأنه ضروري لدي رسائل البريد الإلكتروني هذه، وهناك حوالي 100 روابط. سيتم كشط حوالي 500 رسائل بريد إلكتروني فقط. لا تقلق، أحفظ الأخلاق في الاعتبار هنا.

هل كانت مفيدة؟

المحلول

هناك الكثير من الأسئلة حول هذا الأمر - معظم تلك التي قرأتها القول - لا تستخدم تعبيرات منتظمة لتخليص الويب.

من ناحية أخرى - إذا كان كل ما تريده هو تحليل نص بغض النظر عن طبيعة HTML للنص (الذي تقوم به إذا فهمت لك بشكل صحيح)، فقد يكون من الأفضل استخدام التعبيرات العادية.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top