この正規表現では、これらのUnicode文字（コードポイント）はどういう意味ですか？

https://stackoverflow.com/questions/187981

06-07-2019
|

質問

次の正規表現があります：次の部分の大部分を把握しました。

ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}u00C0-\u00FF°./quot;

u0020 : SPACE
u0027 : APOSTROPHE
u002C : COMMA
u002D : HYPHEN / MINUS
u0030-\u0039\ : 0-9
u0041-\u005A : A - Z
u005F : UNDERSCORE
u0061-\u007A\ : a - z

u00C0-\u00FF°./ : ??

検証式の最後の部分を理解するのに助けが必要です：

<*>

誰もがこれが何を意味するのか知っていますか？

解決

weird ... Windowsの文字マップによると＆quot;＆＃192; ＆＃255;＆quot;

これらは、A、C、E、I、D、N、O、U、Y、ドイツのシャープsのバリエーション（アクセント、セディーユ）です...

他のヒント

\ u00C0-\ u00FFはアクセントの付いた文字ですが、すべてではありません。そして＆quot;＆＃176;＆quot;程度の文字です。ただし、＆quot; ./"おそらく＆quot; \。＆quot;であるべきですピリオド文字を許可します。

質問のタイトルが間違っています。 Unicode コードポイント。たとえば、こちらで確認できます。

これらは、Latin1 Supplementの後半で、アクセントのあるボーカルやその他のキャラクターを含みます。上記のリンクを参照してください。

http://rishida.net/scripts/uniview/conversion.php わかった： '、-0-9A-Z_a-z＆＃192;-＆＃255;

Unicodeエスケープシーケンスとは何かを理解していないかのように、元の文字列を分割した結果は奇妙に見えます。むしろ次のようになります。

\u0020
\u0027
\u002C
\u002D
\u0030-\u0039
\u0041-\u005A
\u005F
\u0061-\u007A
\u00C0-\u00FF
°
.
/

Unicode Webサイトでこれらのコードポイントの意味を調べることができます。

https://www.unicode.org/charts/PDF/U0000.pdf （基本ラテン）
https://www.unicode.org/charts/PDF/U0080.pdf （Latin-1サプリメント）
https://www.unicode.org/charts/PDF/U1F600.pdf （絵文字）

最後の3文字は正確に書かれたものを意味します：

度記号
ドット/ピリオド/フルストップ
スラッシュ

拡張ASCIIチャート

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow