¿Qué significan estos caracteres Unicode (puntos de código) en esta expresión regular?
-
06-07-2019 - |
Pregunta
Tengo la siguiente expresión regular: Descubrí la mayor parte de la parte que es la siguiente:
ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}u00C0-\u00FF°./quot; u0020 : SPACE u0027 : APOSTROPHE u002C : COMMA u002D : HYPHEN / MINUS u0030-\u0039\ : 0-9 u0041-\u005A : A - Z u005F : UNDERSCORE u0061-\u007A\ : a - z u00C0-\u00FF°./ : ??
Necesita ayuda para comprender la parte final de la expresión de validación:
<*>¿Alguien tiene alguna idea de qué significa esto?
Solución
raro ... según el mapa de caracteres en Windows, diría '' a ÿ ''
Esas son algunas variaciones (acentos, cedillas) en A, C, E, I, D, N, O, U, Y, el alemán Sharp s, ...
Otros consejos
\ u00C0 - \ u00FF son letras con acentos, aunque eso no es todo. Y '' ° '' es solo el grado de personaje. Sin embargo, " ./" probablemente debería ser '' \. '' para permitir caracteres de punto.
Su pregunta está mal escrita, desea ayuda con Unicode puntos de código . Puede verificarlos, por ejemplo, aquí .
Son la segunda mitad del suplemento Latin1, incluidas las voces acentuadas y algunos otros personajes. Vea los enlaces de arriba.
Utilizando http://rishida.net/scripts/uniview/conversion.php Obtuve: ', -0-9A-Z_a-zÀ-ÿ
Su resultado de dividir la cadena original parece extraño, como si no hubiera entendido qué es una secuencia de escape Unicode. Más bien debería verse así:
\u0020
\u0027
\u002C
\u002D
\u0030-\u0039
\u0041-\u005A
\u005F
\u0061-\u007A
\u00C0-\u00FF
°
.
/
Puede buscar el significado de estos puntos de código en el sitio web de Unicode:
- https://www.unicode.org/charts/PDF/U0000.pdf (latín básico)
- https://www.unicode.org/charts/PDF/U0080.pdf (Suplemento Latin-1)
- https://www.unicode.org/charts/PDF/U1F600.pdf (Emoticones)
Los últimos tres caracteres significan exactamente lo que está escrito:
- signo de grado
- punto / punto / punto final
- barra diagonal
Parece ser el rango de caracteres presentado en las últimas 2 columnas en la TABLA ASCII-II en el siguiente enlace a El cuadro ASCII extendido