我正在尝试解析雅虎答案供稿 - http://answers.yahoo.com/rss/allq问题是标题有

类别]:开放问题:

在我不想要的每个标题中...我想编写一个regexp来删除此...

我们可以删除启动中所有字母的任何事情[和第一个:应该做。

有一个空间之后 : 另外,我们也需要删除它。

感谢您提前,我还将尝试自己找到解决方案。

有帮助吗?

解决方案

您是否考虑过使用Yahoo的 yql 解析此提要(或其他网页)的服务?

他们已经有示例查询供您获取Yahoo Answers数据:

(如果您不知道这项方便的服务,只是一个小五。我使用它而不是用Regex的屏幕刮擦。)

其他提示

以下正则应当做这项工作:

^\[.*?: 

C#中的使用样本:

string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");

它的作用是从 [ 支架并取得任何字符,直到它与 : 并占用易怒空间。

希望这会有所帮助,汤姆。

谢谢 @ cmptrgeekken 指出非贪婪的东西!

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top