Frage

Ich habe eine Funktion, dass ich ein paar Mal in verschiedenen Dateien, die eine Signatur verwendet habe, wie:

Translate("English Message", "Spanish Message", "French Message")

, und ich bin zu wollen, das Englisch, Spanisch und Französisch Nachrichten ziehen und dann gibt sie in eine csv, so dass Menschen, die diese Sprachen, die tatsächlich wissen können mir sagen, was ich soll ihm haben, setzen.

Wie auch immer, was ich in laufen lasse, ist, dass einige Französisch und Spanisch Nachrichten zeigen nach oben nicht wegen der akzentuierten Zeichen und einfache Anführungszeichen.

Dies ist ein vb.net Programm.

Bearbeiten

Es gab kein Problem mit der Sprache, mein Problem war eigentlich der reguläre Ausdruck und meine völlige Fehlen von regulären Ausdrücken zu verstehen.

War es hilfreich?

Lösung

Abhängig von der regex Bibliothek Sie verwenden. Sane Regex-Implementierungen verwenden UTF-8 und haben keine solchen Probleme, aber mehr Details wäre hilfreich, zu wissen, was lang Sie verwenden, was Bibliothek regex etc.

Andere Tipps

Wenn es eine DOTALL Flagge regex Implementierung in Ihrer Sprache der ist, könnte man es einstellen möchten.

Alternativ die Regex ändern, um eine negierte Zeichenklasse statt zu erfassen, etwa so:

([^your_delimiter]*?)

mit your_delimiter wobei die Stelle (n) sofort die Zeichenfolge Erfolg, den Sie aufnehmen möchten.

Sehen Sie diese für die weitere Diskussion:

http://en.wikipedia.org/wiki/Regular_expression#Unicode

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top