Cosa significano questi caratteri Unicode (punti di codice) in questa regex?
-
06-07-2019 - |
Domanda
Ho la seguente espressione regolare: Ho capito la maggior parte della parte che è la seguente:
ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}u00C0-\u00FF°./quot; u0020 : SPACE u0027 : APOSTROPHE u002C : COMMA u002D : HYPHEN / MINUS u0030-\u0039\ : 0-9 u0041-\u005A : A - Z u005F : UNDERSCORE u0061-\u007A\ : a - z u00C0-\u00FF°./ : ??
Hai bisogno di aiuto per comprendere la parte finale dell'espressione di validazione:
<*>Qualcuno ha idea di cosa significhi?
Soluzione
strano ... secondo la mappa dei caratteri su Windows direi da " À a ÿ "
Queste sono alcune variazioni (accenti, cedillas) su A, C, E, I, D, N, O, U, Y, gli Sharp tedeschi, ...
Altri suggerimenti
\ u00C0 - \ u00FF sono lettere con accenti, sebbene non siano tutte. E " ° " è solo il carattere di laurea. Tuttavia, " ./" dovrebbe probabilmente essere " \. " per consentire i caratteri punto.
La tua domanda è sbagliata, vuoi aiuto con Unicode codepoints . Puoi controllarli, ad esempio, qui .
Sono la seconda metà del Supplemento Latin1, tra cui voci accentate e alcuni altri personaggi. Vedi i link sopra.
Uso di http://rishida.net/scripts/uniview/conversion.php Ho ottenuto: ', -0-9A-Z_a-z & # 192; - & # 255;
Il risultato della divisione della stringa originale sembra strano, come se non avessi capito cos'è una sequenza di escape Unicode. Dovrebbe piuttosto apparire come:
\u0020
\u0027
\u002C
\u002D
\u0030-\u0039
\u0041-\u005A
\u005F
\u0061-\u007A
\u00C0-\u00FF
°
.
/
Puoi cercare il significato di questi punti di codice sul sito Unicode:
- https://www.unicode.org/charts/PDF/U0000.pdf (latino di base)
- https://www.unicode.org/charts/PDF/U0080.pdf (Supplemento Latino-1)
- https://www.unicode.org/charts/PDF/U1F600.pdf (Emoticon)
Gli ultimi tre caratteri significano esattamente ciò che è scritto:
- segno di laurea
- punto / punto / punto completo
- barra rovesciata
Sembra essere la gamma di caratteri presentati nelle ultime 2 colonne in TABELLA ASCII-II al seguente link a Il grafico ASCII esteso