O que esses caracteres Unicode (Codepoints) significa, neste regex?
-
06-07-2019 - |
Pergunta
Eu tenho a seguinte expressão regular: Eu descobri a maioria da parte que é a seguinte:
ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}$" u0020 : SPACE u0027 : APOSTROPHE u002C : COMMA u002D : HYPHEN / MINUS u0030-\u0039\ : 0-9 u0041-\u005A : A - Z u005F : UNDERSCORE u0061-\u007A\ : a - z u00C0-\u00FF°./ : ??
Precisa de ajuda na compreensão da parte final da expressão de validação:
u00C0-\u00FF°./
Alguém tem alguma idéia do que isso significa?
Solução
estranho ... de acordo com o mapa de caracteres no Windows eu diria "A a Y"
Aqueles são algumas variações (acentos, cedilhas) em A, C, E, I, D, N, O, L, Y, o alemão afiada s, ...
Outras dicas
\ u00C0 - \ u00FF são letras com acentos sobre eles, embora isso não é tudo deles. E "°" é apenas o caráter grau. No entanto, "./" provavelmente deve ser '\'. para caracteres período da licença.
A sua pergunta é mistitled, você quer ajuda com Unicode codepoints . Você pode vê-los, por exemplo, aqui .
Eles são a segunda metade do Latin1 Supplement, incluindo vocais acentuadas e alguns outros personagens. Veja acima as ligações.
Usando http://rishida.net/scripts/uniview/conversion.php Eu tenho:', -0-9A-Z_a-za-Y
O seu resultado de dividir a string original parece estranho, como se não tivesse entendido o que uma sequência de escape Unicode é. Deve sim ser parecido:
\u0020
\u0027
\u002C
\u002D
\u0030-\u0039
\u0041-\u005A
\u005F
\u0061-\u007A
\u00C0-\u00FF
°
.
/
Você pode procurar o significado destes pontos de código no site do Unicode:
- https://www.unicode.org/charts/PDF/U0000.pdf (latim básico)
- https://www.unicode.org/charts/PDF/U0080.pdf (Latin-1 Supplement)
- https://www.unicode.org/charts/PDF/U1F600.pdf (Emoticons)
Os três últimos caracteres significam exatamente o que está escrito:
- sinal de grau
- dot / período / ponto final
- barra
Parece ser a gama de personagens apresentados nos últimos 2 colunas na tabela ASCII-II no seguinte link para O Gráfico ASCII estendida