Что означают эти символы Юникода (кодовые точки) в этом регулярном выражении?
-
06-07-2019 - |
Вопрос
У меня есть следующее регулярное выражение :Я разобрался с большей частью, которая заключается в следующем :
ValidationExpression="^[\u0020\u0027\u002C\u002D\u0030-\u0039\u0041-\u005A\u005F\u0061-\u007A\u00C0-\u00FF°./]{1,256}$" u0020 : SPACE u0027 : APOSTROPHE u002C : COMMA u002D : HYPHEN / MINUS u0030-\u0039\ : 0-9 u0041-\u005A : A - Z u005F : UNDERSCORE u0061-\u007A\ : a - z u00C0-\u00FF°./ : ??
Нужна помощь в понимании заключительной части выражения проверки :
u00C0-\u00FF°./
У кого-нибудь есть какие-нибудь идеи, что это значит?
Решение
странно ... в соответствии с картой символов в Windows я бы сказал " & # 192; на & # 255; "
Это некоторые вариации (акценты, cedillas) на A, C, E, I, D, N, O, U, Y, немецком Sharp s, ...
Другие советы
\ u00C0 - \ u00FF - это буквы с акцентами на них, хотя это еще не все. И " & # 176; это просто символ степени. Однако " ./" должно быть "\". разрешить символы периода.
Ваш вопрос ошибочен, вам нужна помощь с Unicode кодовые точки . Вы можете проверить их, например, здесь .
Это вторая часть дополнения Latin1, включающая акцент на вокале и некоторых других персонажах. Смотрите вышеупомянутые ссылки.
Использование http://rishida.net/scripts/uniview/conversion.php Я получил: ', -0-9A-Z_a-z & # 192; - & # 255;
Ваш результат разделения исходной строки выглядит странно, как будто вы не поняли, что такое escape-последовательность в Юникоде.Скорее всего, это должно выглядеть так:
\u0020
\u0027
\u002C
\u002D
\u0030-\u0039
\u0041-\u005A
\u005F
\u0061-\u007A
\u00C0-\u00FF
°
.
/
Вы можете ознакомиться со значением этих кодовых точек на веб-сайте Unicode:
- https://www.unicode.org/charts/PDF/U0000.pdf (Базовая латынь)
- https://www.unicode.org/charts/PDF/U0080.pdf (Латиница-1 Дополнение)
- https://www.unicode.org/charts/PDF/U1F600.pdf (Смайлики)
Последние три символа означают именно то, что написано:
- знак степени
- точка/точка/ полная остановка
- косая черта вперед
Похоже, это диапазон символов, представленных в последних 2 столбцах ТАБЛИЦЫ ASCII-II по следующей ссылке на Расширенная диаграмма ASCII