REGEXP简化Yahoo Answers feed标题
题
我正在尝试解析雅虎答案供稿 - http://answers.yahoo.com/rss/allq问题是标题有
类别]:开放问题:
在我不想要的每个标题中...我想编写一个regexp来删除此...
我们可以删除启动中所有字母的任何事情[和第一个:应该做。
有一个空间之后 :
另外,我们也需要删除它。
感谢您提前,我还将尝试自己找到解决方案。
解决方案
您是否考虑过使用Yahoo的 yql 解析此提要(或其他网页)的服务?
他们已经有示例查询供您获取Yahoo Answers数据:
答案。getByCategory: http://developer.yahoo.com/yql/console/#h=select%20*%20 from%20种。getByCategory%20 Where%20CATEGORY_ID%3D2115500137%20和%20型%3D%22 Resolved%22
答案。getByuser: http://developer.yahoo.com/yql/console/#h=select%20*%20%的20个植物。GETBYUSER%20 Where%20USER_ID%3D%22ybamgthfaa%22
答案。getQuestion: http://developer.yahoo.com/yql/console/#h=select%20*%20%20种。GETQUESTION%20 where%20Question_id%3D%2220090526102023AAKRBCH%22
答案:搜索: http://developer.yahoo.com/yql/console/#h=select%20*%20%20种居民。Search%20 Where%20Query%3D%22CARS%22%20和20%20 Category_id%3D2115500137%20AND%20 and%20Type%3D%22固定%22
(如果您不知道这项方便的服务,只是一个小五。我使用它而不是用Regex的屏幕刮擦。)
其他提示
以下正则应当做这项工作:
^\[.*?:
C#中的使用样本:
string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");
它的作用是从 [
支架并取得任何字符,直到它与 :
并占用易怒空间。
希望这会有所帮助,汤姆。
谢谢 @ cmptrgeekken 指出非贪婪的东西!