什么做这些Unicode字符的(代码点)的意思是在这regex?
-
06-07-2019 - |
题
我有以下的规则的表达:我想出最多的部分如下:
ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}$" u0020 : SPACE u0027 : APOSTROPHE u002C : COMMA u002D : HYPHEN / MINUS u0030-\u0039\ : 0-9 u0041-\u005A : A - Z u005F : UNDERSCORE u0061-\u007A\ : a - z u00C0-\u00FF°./ : ??
需要有助于理解最终验证的一部分的表达:
u00C0-\u00FF°./
任何人有任何想法这是什么意思?
解决方案
很奇怪......根据Windows上的角色地图,我会说“À到ÿ"
这些是A,C,E,I,D,N,O,U,Y,德国夏普的一些变化(口音,cedillas)......
其他提示
\ u00C0 - \ u00FF是带有重音符号的字母,但不是全部。并且“°”只是学位角色。但是,“。/"应该是“\”。允许期间字符。
使用 http://rishida.net/scripts/uniview/conversion.php 我得到了:', - 0-9A-Z_a-zÀ-ÿ
你的结果,分裂的原串看起来怪怪的,因为如果你没有理解什么是Unicode的逃生顺序。它应该是这样的:
\u0020
\u0027
\u002C
\u002D
\u0030-\u0039
\u0041-\u005A
\u005F
\u0061-\u007A
\u00C0-\u00FF
°
.
/
你可以查查的意义,这些代码点在Unicode网站:
- https://www.unicode.org/charts/PDF/U0000.pdf (基本拉丁语)
- https://www.unicode.org/charts/PDF/U0080.pdf (拉丁语-1补充)
- https://www.unicode.org/charts/PDF/U1F600.pdf (表情)
最后三个字的意思是什么写的是:
- 程度的标志
- dot/期限/完全停止
- 斜线
它似乎是表ASCII-II中最后两列中显示的字符范围,位于以下链接扩展的ASCII图表
不隶属于 StackOverflow