سؤال

أحاول تحليل تغذية إجابات ياهو - http://answers.yahoo.com/rss/allqالقضية هي أن العناوين لها

الفئة]: سؤال مفتوح:

في كل عنوان لا أريده ... أريد أن أكتب regexp لإزالة هذا ...

أي شيء يمكننا القيام به لإزالة جميع الحروف في البداية [والأولى: يجب أن تفعل ذلك.

هناك مساحة بعد : أيضا ، نحن بحاجة إلى إزالة ذلك أيضا.

شكرًا على هذا مقدمًا ، سأحاول أيضًا العثور على حل بنفسي.

هل كانت مفيدة؟

المحلول

هل فكرت في استخدام Yahoo's YQL خدمة لتحليل هذه الخلاصة (أو صفحات الويب الأخرى)؟

لديهم بالفعل عينة من استفسارات لك للحصول على بيانات إجابات Yahoo:

(مجرد لمعلوماتك في حال لم تكن على دراية بهذه الخدمة المريحة. أنا أستخدمها بدلاً من الشاشة التي تجدها مع Regex.)

نصائح أخرى

يجب أن يقوم Regex التالي بالوظيفة:

^\[.*?: 

عينة الاستخدام في C#:

string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");

ما تفعله هو البدء بـ [ قوسين وأخذ أي شخصيات حتى يتطابق : وأخذ مساحة follwing.

أتمنى أن يساعد هذا ، توم.

شكرًا @ CMPTRGEEKKEN لتشير إلى شيء غير الجشع!

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top