Frage

würde Ich mag, um zu bestimmen, was die Alphabet für ein bestimmtes Gebietsschema, vorzugsweise basierend auf dem Browser-Accept-Language-Header-Werten. Wer weiß, wie dies zu tun, eine Bibliothek zu verwenden, wenn nötig?

War es hilfreich?

Lösung

einen Blick auf [LocaleData.getExemplarSet] [1]

beispielsweise für Englisch gibt diese abcdefghijklmnopqrstuvwxyz

[1]: http://icu-project.org/apiref/icu4j/com/ibm/icu/util/LocaleData.html#getExemplarSet (com.ibm.icu.util.ULocale , int)

Andere Tipps

Wenn Sie wollen einfach nur den Namen eines entsprechenden Zeichen für einen Benutzer festgelegt wissen Locale dann könnten Sie die nio.CharSet Klasse.

Wenn Sie wirklich die Accept-Language-Header verwendet werden sollen, dann gibt es eine alten O'Reilly Artikel zu diesem Thema, das so genannte ziemlich praktisch Klasse stellt LanguageNegotiator .

Ich denke, einer von denen, geben Sie eine anständige genug beginnen.

Es hängt davon ab, wie bestimmte Sie erhalten möchten. Ein Ort zu suchen wäre bei den „Unterdrückt-Script“ Objekte im IANA Sprache Register .

Einige Sprachen haben mehr „Alphabete“, die zum Schreiben verwendet werden können. Zum Beispiel kann aserbaidschanische in lateinischen oder arabischen Schrift geschrieben werden. Die meisten Sprachen, wie Englisch, werden fast ausschließlich in einem einzigen Skript geschrieben, so das richtige Skript ist selbstverständlich und sollen „unterdrückt“ in Sprachcodes werden.

Also, für Russisch am Eingang suchen, können Sie sagen, dass die bevorzugte Skript Kyrillisch ist, während für äthiopische, es Amharisch ist. Aber Deutsch, Norwegisch und Englisch ist nicht spezifischer als „Latin“. Also, mit dieser Methode würden Sie haben eine harte Zeit Umlaute und Dornen von den Amerikanern versteckt, oder jedes Skript zu einem Kashmiri Schriftsteller an.

Dies ist eine englische Antwort in Århus geschrieben. Gestern hörte ich einige Deutsche 'Blödheit, à propos, ist dumm' sagen. Allerdings trug einer von ihnen ein Hemd, das sagte: ‚Ich kenne den Unterschied zwischen 文字 und العربية‘.

Was ist die Antwort auf Ihre Frage zu diesem Text? Ist es erlaubt? Ist das nicht ein englischer Text?

Die International Components for Unicode könnte hier helfen. Insbesondere die UScript Klasse sieht vielversprechend aus.

Aus Neugier: Was brauchen Sie es für

?
Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top