Expresión regular con las lenguas extranjeras
-
22-09-2019 - |
Pregunta
Tengo una función que he utilizado un montón de veces en varios archivos que tiene una firma como:
Translate("English Message", "Spanish Message", "French Message")
y yo estoy queriendo sacar el Inglés, Español y mensajes franceses y luego los de salida en un archivo CSV para que las personas que realmente saben idiomas pueden decirme lo que debería haber puesto allí.
De todos modos, lo estoy corriendo en es que algunos franceses y españoles mensajes no se presentan debido a los caracteres acentuados y comillas simples.
Este es un programa de vb.net.
Editar
No había ningún problema con el idioma, mi problema era en realidad la expresión regular y mi completa falta de comprensión de las expresiones regulares.
Solución
Depende de la biblioteca de expresiones regulares que está utilizando. implementaciones de expresiones regulares Sane utilizar UTF-8 y no tienen este tipo de problemas, pero más detalles serían útiles acerca de lo lang que está utilizando, lo que regex biblioteca, etc.
Otros consejos
Si hay una bandera dotall en la implementación de expresiones regulares de su idioma, puede que desee para establecerlo.
Como alternativa, cambie la expresión regular para capturar una clase de caracteres negada en su lugar, así:
([^your_delimiter]*?)
con your_delimiter ser el personaje (s) inmediatamente posterior a la cadena que desea capturar.
Ver este para continuar el debate: