Differenziare tra simbolo, numero e codepoint lettera in Unicode?
-
26-12-2019 - |
Domanda
Unicode ha un enorme numero di codepoint, come posso controllare Weter un codepoint è un simbolo (come "!" o "☭"), un numero (come "4" o "9"), una lettera (come "A "o" え ") o un carattere di controllo (di solito non vengono visualizzati direttamente)?
C'è una logica dietro la posizione del personaggio e che tipo di carattere è (al contrario di quale alfabeto fa parte), in caso contrario, ci sono risorse esistenti che classificano quali gambi sono cosa?
.Soluzione
che sarebbe stato fatto attraverso il Categoria generale Proprietà di tali codepoint.Fa parte del set di dati canonico UnicodeData.txt
e ogni seria libreria relativa a Unicode dovrebbe avere qualche modo per ottenere questa proprietà.
Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow