regexp لتبسيط عنوان تغذية الإجابات ياهو
سؤال
أحاول تحليل تغذية إجابات ياهو - http://answers.yahoo.com/rss/allqالقضية هي أن العناوين لها
الفئة]: سؤال مفتوح:
في كل عنوان لا أريده ... أريد أن أكتب regexp لإزالة هذا ...
أي شيء يمكننا القيام به لإزالة جميع الحروف في البداية [والأولى: يجب أن تفعل ذلك.
هناك مساحة بعد :
أيضا ، نحن بحاجة إلى إزالة ذلك أيضا.
شكرًا على هذا مقدمًا ، سأحاول أيضًا العثور على حل بنفسي.
المحلول
هل فكرت في استخدام Yahoo's YQL خدمة لتحليل هذه الخلاصة (أو صفحات الويب الأخرى)؟
لديهم بالفعل عينة من استفسارات لك للحصول على بيانات إجابات Yahoo:
الإجابات. getByCategory: http://developer.yahoo.com/yql/console/#h=select٪20*٪ 20From ٪ 20Answers.getByCategory ٪ 20 Whye
الإجابات. getByuser: http://developer.yahoo.com/yql/console/#h=select٪20*٪ 20From ٪ 20Answers.getByuser ٪ 20 Whye
الإجابات. getQuestion: http://developer.yahoo.com/yql/console/#h=select٪20*٪ 20From ٪ 20Answers.getQuestion ٪ 20 Whye
الإجابات. البحث: http://developer.yahoo.com/yql/console/#h=select٪20*٪ 20From ٪ 20Answers.Search ٪ 20where ٪ 20query ٪ 3d ٪ 22cars ٪ 22 ٪ 20 و ٪ 20Category_ID ٪ 3D2115500137 ٪ 20 و ٪ 20type ٪ 3d ٪ 22reslved ٪ 22 22
(مجرد لمعلوماتك في حال لم تكن على دراية بهذه الخدمة المريحة. أنا أستخدمها بدلاً من الشاشة التي تجدها مع Regex.)
نصائح أخرى
يجب أن يقوم Regex التالي بالوظيفة:
^\[.*?:
عينة الاستخدام في C#:
string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");
ما تفعله هو البدء بـ [
قوسين وأخذ أي شخصيات حتى يتطابق :
وأخذ مساحة follwing.
أتمنى أن يساعد هذا ، توم.
شكرًا @ CMPTRGEEKKEN لتشير إلى شيء غير الجشع!