我希望这是程序员相关的问题。我从事C#编程的业余爱好。为了我自己的目的,我需要解析html文件,最好的想法是..正则表达式。正如许多人发现的那样,学习它们非常耗时,因此如果您了解一些能够采用输入(任何代码片段)的应用程序,我很感兴趣,了解我需要什么(由我选择我需要的一部分代码“剪掉”),为我或其他选项提供正确的正则表达式

正如我所听到的,正则表达式本身就是一门科学,所以它可能并不像我想象的那么容易。

有帮助吗?

解决方案

是的,Roy Osherove写下了您正在寻找的内容 - regulazy

其他提示

不是您的问题的真实答案,因为它与正则表达式无关,但 HtmlAgilityPack 可能帮助您解析。

您可能还想尝试txt2re: http://txt2re.com/ ,它会尝试识别模式在用户提供的字符串中,允许从中创建正则表达式。

我必须同意Sunny的观点:如果你正在解析html,你最好把它转换成XML(使用HTML Agility包它很简单)然后你可以使用XPATH表达式而不是正则表达式,它更适合这项工作。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top