Was bedeuten diese Unicode-Zeichen (Codepoints) in dieser Regex?
-
06-07-2019 - |
Frage
Ich habe den folgenden regulären Ausdruck: Ich dachte, die meisten Seiten aus, die sich wie folgt:
ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}$" u0020 : SPACE u0027 : APOSTROPHE u002C : COMMA u002D : HYPHEN / MINUS u0030-\u0039\ : 0-9 u0041-\u005A : A - Z u005F : UNDERSCORE u0061-\u007A\ : a - z u00C0-\u00FF°./ : ??
Hilfe nötig den letzten Teil des Validierungs Ausdruck verstehen:
u00C0-\u00FF°./
Wer hat eine Ahnung, was bedeutet das?
Lösung
seltsam ... nach der Zeichentabelle auf Windows würde ich sagen „a bis y“
Das sind einige Variationen (Akzente, Cedillen) auf A, C, E, I, D, N, O, U, Y, das Deutsch Sharp s, ...
Andere Tipps
\ u00C0 - \ u00FF sind Buchstaben mit Akzenten auf sie, wenn auch, dass nicht alle von ihnen. Und „°“ ist nur der Grad Charakter. Doch „./“ sollte wohl ‚\.‘ Zeit Zeichen zu ermöglichen.
Ihre Frage ist mistitled, möchten Sie helfen mit Unicode Codepoints . Sie können sie überprüfen, zum Beispiel hier .
Sie sind die zweite Hälfte des Latein1 Supplement, einschließlich akzentuierten Gesang und einige andere Zeichen. Siehe die obigen Links.
Mit http://rishida.net/scripts/uniview/conversion.php Ich habe:‘-0-9A-z_a-Za-ÿ
Ihr Ergebnis die ursprüngliche Zeichenfolge des Teilens sieht seltsam, als ob Sie nicht verstanden hatte, was für eine Unicode-Escape-Sequenz ist. Es sollte eher wie folgt aussehen:
\u0020
\u0027
\u002C
\u002D
\u0030-\u0039
\u0041-\u005A
\u005F
\u0061-\u007A
\u00C0-\u00FF
°
.
/
Sie können die Bedeutung dieser Codepunkte auf der Unicode-Website nachschlagen:
- https://www.unicode.org/charts/PDF/U0000.pdf (Basic Latin)
- https://www.unicode.org/charts/PDF/U0080.pdf (Latin-1 Supplement)
- https://www.unicode.org/charts/PDF/U1F600.pdf (Emoticons)
Die letzten drei Zeichen bedeuten genau das, was geschrieben steht:
- Grad Zeichen
- Punkt / Zeit / full stop
- Schrägstrich
Es sieht aus der Reihe von Zeichen in den letzten 2 Spalten in der Tabelle ASCII-II unter folgendem Link auf Das erweiterte ASCII-Diagramm