我有我已经使用一束在各种文件时间,这有一个签名等的函数:

Translate("English Message", "Spanish Message", "French Message")

和我想拔出英语,西班牙语和法语的消息,然后将其输出到CSV使人们谁真正知道这些语言都可以告诉我,我应该把在那里。

不管怎样,我遇到的是,一些法语和西班牙语的消息不显示,因为重音符号和单引号了。

这是一个vb.net程序。

修改

有是在语言没问题,我的问题实际上是正则表达式和我的完全缺乏理解正则表达式。

有帮助吗?

解决方案

取决于正在使用的正则表达式库。理智的正则表达式实现使用UTF-8,有没有这样的问题,但更多的细节将是有益的关于你正在使用郎,什么正则表达式库等。

其他提示

如果有在你的语言的正则表达式实施DOTALL标志,你可能需要设置它。

可替换地,改变正则表达式来捕获否定的字符类,而不是,像这样:

([^your_delimiter]*?)

与your_delimiter是字符(或多个)紧接在后的字符串要捕获。

作进一步的讨论,请参阅本:

http://en.wikipedia.org/wiki/Regular_expression#Unicode

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top