この正規表現では、これらのUnicode文字(コードポイント)はどういう意味ですか?
-
06-07-2019 - |
質問
次の正規表現があります: 次の部分の大部分を把握しました。
ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}u00C0-\u00FF°./quot; u0020 : SPACE u0027 : APOSTROPHE u002C : COMMA u002D : HYPHEN / MINUS u0030-\u0039\ : 0-9 u0041-\u005A : A - Z u005F : UNDERSCORE u0061-\u007A\ : a - z u00C0-\u00FF°./ : ??
検証式の最後の部分を理解するのに助けが必要です:
<*>誰もがこれが何を意味するのか知っていますか?
解決
weird ... Windowsの文字マップによると&quot;&#192; &#255;&quot;
これらは、A、C、E、I、D、N、O、U、Y、ドイツのシャープsのバリエーション(アクセント、セディーユ)です...
他のヒント
\ u00C0-\ u00FFはアクセントの付いた文字ですが、すべてではありません。そして&quot;&#176;&quot;程度の文字です。ただし、&quot; ./"おそらく&quot; \。&quot;であるべきですピリオド文字を許可します。
http://rishida.net/scripts/uniview/conversion.php わかった: '、-0-9A-Z_a-z&#192;-&#255;
Unicodeエスケープシーケンスとは何かを理解していないかのように、元の文字列を分割した結果は奇妙に見えます。むしろ次のようになります。
\u0020
\u0027
\u002C
\u002D
\u0030-\u0039
\u0041-\u005A
\u005F
\u0061-\u007A
\u00C0-\u00FF
°
.
/
Unicode Webサイトでこれらのコードポイントの意味を調べることができます。
- https://www.unicode.org/charts/PDF/U0000.pdf (基本ラテン)
- https://www.unicode.org/charts/PDF/U0080.pdf (Latin-1サプリメント)
- https://www.unicode.org/charts/PDF/U1F600.pdf (絵文字)
最後の3文字は正確に書かれたものを意味します:
- 度記号
- ドット/ピリオド/フルストップ
- スラッシュ
所属していません StackOverflow