Quelles sont les groupes `Unicode 'et les` Block Ranges` qui peuvent être spécifiés dans ` p {name}`?

StackOverflow https://stackoverflow.com/questions/9002722

Question

Quels sont les unicode groups et block ranges qui peut être spécifié dans la classe de caractères \p{name}?

par exemple

\p{IsGreek}

Où est la liste des noms et description disponibles?

Était-ce utile?

La solution

Régulier-expressions.info a des listes.

Vous pouvez également demander au pages d'homme de pcre lui-même:

Les ensembles de caractères Unicode sont définis comme appartenant à certains scripts. Un personnage de l'un de ces ensembles peut être apparié à l'aide d'un nom de script. Par exemple:

\p{Greek}
\P{Han}

Ceux qui ne font pas partie d'un script identifié sont regroupés comme «communs». La liste actuelle des scripts est:

Arabe, Arménien, Avestan, Balinais, Bamum, Bengali, Bopomofo, Braille, Buginese, Buhid, Canadian_aboriginal, Carian, Cham, Cherokee, Common, Coptic, Cuneiform, Cyprio Gothic, grec, gujarati, gurmukhi, han, hangul, hanunoo, hébreu, hiragana, impérial_aramic, hérité, inscriptional_pahlavi, inscriptional_parthian, javanais, kaithi, kannada, katakana, kayah_li, kharoshi Lisu, Lycian, Lydian, Malayalam, Meetei_Mayek, Mongolian, Myanmar, New_Tai_Lue, Nko, Ogham, Old_italic, Old_persian, Old_South_arabian, Old_Turkic, Ol_chiki, Oriya, Osmanya, Phags_pa Sundanais, Syloti_Nagri, Syriac, Tagalog, Tagbanwa, Tai_le, Tai_tham, Tai_Viet, Tamil, Telugu, Thaana, Thai, Tibetan, Tifinagh, Ugaritic, Vai, Yi.

Autres conseils

Ici, vous pouvez trouver une liste des Propriétés des caractères Unicode que vous pouvez spécifier entre parenthèses: http://en.wikipedia.org/wiki/mapping_of_unicode_characters#categories

Ou vous pouvez correspondre Blocs Unicode ou Scripts, vous pouvez trouver des informations à ce sujet ici:http://www.regular-expressions.info/unicode.html#block et http://www.regular-expressions.info/unicode.html#script.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top