regexp yahoo Answers Feedタイトルを簡素化します
質問
私はYahoo Answers Feedを解析しようとしています - http://answers.yahoo.com/rss/allq問題は、タイトルにあることです
カテゴリ]:オープン質問:
私が望んでいないすべてのタイトルで...私はこれを削除するためにregexpを書きたいです...
開始のすべての文字を削除するために私たちが作ることができるものは何でも[そして最初:それをする必要があります。
その後のスペースがあります :
また、それも削除する必要があります。
事前にこれをありがとう、私も自分で解決策を見つけようとします。
解決
Yahooの使用を検討しましたか YQL このフィード(または他のWebページ)を解析するサービス?
彼らはすでにあなたがYahooの回答データを取得するためのサンプルクエリを持っています:
Answers.GetByCategory: http://developer.yahoo.com/yql/console/#h = select%20*%20 from%20answers.getBycategory%20where%20category_id%3d2115500137%20 and%20type%3d%22分解%22
Answers.GetByUser: http://developer.yahoo.com/yql/console/#h = select%20*%20 from%20answers.getByuser%20where%20user_id%3d%22ybamgthfaa%22
Answers.getquestion: http://developer.yahoo.com/yql/console/#h = select%20*%20 from%20answers.getquestion%20where%20 question_id%3d%2220090526102023aakrbch%22
Answers.Search: http://developer.yahoo.com/yql/console/#h = select%20*%20 from%20answers.Search%20where%20 Query%3D%22CARS%22%20and%20Category_id%3D2115500137%20and%20Type%3D%22分解%22
(この便利なサービスに気付いていなかった場合のFYI。私はRegexでスクリーンスクレイピングする代わりにそれを使用します。)
他のヒント
次の正規表現は仕事をする必要があります。
^\[.*?:
C#の使用サンプル:
string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");
それがすることは、から始めることです [
ブラケットとそれが一致するまで任意の文字を取ります :
そして、次のスペースを取ります。
これが役立つことを願っています、トム。
ありがとう @ cmptrgeekken 非貪欲なことを指摘してくれて!