Java でロケールのアルファベットが何であるかを確認するにはどうすればよいですか?

https://stackoverflow.com/questions/417377

03-07-2019
|

質問

何があるか判断したいのですが、 アルファベット 特定のロケールの場合は、ブラウザーの Accept-Language ヘッダー値に基づくことが望ましいです。必要に応じてライブラリを使用してこれを行う方法を知っている人はいますか?

解決

[LocaleData.getExemplarSet] [1]をご覧ください

たとえば英語の場合、これはabcdefghijklmnopqrstuvwxyzを返します

[1]： http://icu-project.org/apiref/icu4j/com/ibm/icu/util/LocaleData.html#getExemplarSet（com.ibm.icu.util.ULocale 、int）

他のヒント

ユーザーのロケールに適切な文字セットの名前を知りたいだけの場合は、次のコマンドを試してください。 nio.CharSet クラス。

本当に Accept-Language ヘッダーを使用したい場合は、古いヘッダーがあります。オライリーの記事これに関しては、という非常に便利なクラスが導入されています。言語ネゴシエーター.

そのうちの 1 つで十分なスタートが切れると思います。

どの程度具体的に取得したいかによって異なります。見たい場所の1つは、「Suppress-Script」です。 IANA言語レジストリのプロパティ。

一部の言語には複数の「アルファベット」があります。書き込みに使用できます。たとえば、アゼルバイジャン語はラテン語またはアラビア語のスクリプトで記述できます。英語のようなほとんどの言語は、ほぼ排他的に単一のスクリプトで記述されているため、正しいスクリプトは言うまでもなく「抑制」する必要があります。言語コードで。

したがって、ロシア語のエントリを見ると、優先スクリプトはキリル文字であることがわかりますが、エチオピア語の場合はアムハラ語です。しかし、ドイツ語、ノルウェー語、および英語は、「ラテン語」よりも具体的ではありません。そのため、この方法では、アメリカ人からウムラウトやトゲを隠すことや、カシミールの作家にスクリプトを提供することは困難です。

これは＆＃197; rhusで書かれた英語の回答です。昨日、ドイツ人の中には「Bl＆＃246; dheit、＆＃224; propos、is dum 'ただし、そのうちの1人は、「＆＃25991;＆＃23383;および＆＃1575;＆＃1604;＆＃1618;＆＃1593;＆＃1614;＆＃1585;＆＃1614;＆＃1576;＆＃1610;＆＃1617;＆＃1577; '。

このテキストに対するあなたの質問に対する答えは何ですか？許可されていますか？これは英語のテキストではありませんか？

Unicodeの国際コンポーネントが役立つ場合があります。具体的には、 UScript クラスは有望に見えます。

好奇心から：何のために必要ですか？

ライセンス： CC-BY-SA と帰属

所属していません StackOverflow