質問

私はのような署名を持っているさまざまなファイル内の時間の束を使用していることの機能を持っています:

Translate("English Message", "Spanish Message", "French Message")

と私は実際にこれらの言語を知っている人は、私はそこに入れているべきであるものを私に伝えることができるように、英語、スペイン語、フランス語のメッセージを引き出した後、csvファイルに出力することをしたいと思っています。

とにかく、私はに実行していますと、いくつかのフランス語とスペイン語のメッセージが原因アクセント付き文字や単一引用符で表示されないということです。

このはvb.netプログラムです。

編集

言語には問題ありませんでした、私の問題は、実際に正規表現と正規表現を理解する私の完全な欠如しています。

役に立ちましたか?

解決

は、使用している正規表現ライブラリに依存します。正気の正規表現の実装は、UTF-8を使用し、そのような問題を持っていないが、より詳細には、およそ参考になるものをなど。

ライブラリregexで何を使用しているLANG、

他のヒント

あなたの言語の正規表現の実装でDOTALLフラグがある場合は、

は、あなたがそれを設定することをお勧めします。

また、これと同様に、代わりに否定文字クラスをキャプチャするために正規表現を変更

([^your_delimiter]*?)

your_delimiterはすぐに取り込みたいという文字列に続く文字(複数可)された状態でます。

さらなる議論のためにこれを参照してください。

http://en.wikipedia.org/wiki/Regular_expression#Unicodeする

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top