チャイナキャラクターBopomofo / Pinyinデータはどこにありますか?
-
21-12-2019 - |
質問
Bopomofoおよび/またはPinyinのすべての中国語のキャラクターのマンダリンの発音を持つデータセットを探しています。また、自分のコードベースにコピーできるオープンソースデータセットが必要です。
解決
あなたがunihanデータベースを探しているかもしれないように聞こえます。 UnihanデータベースはUnicodeコンソーシアムによって維持されています。
Unihanデータベースは、Unicodeコンソーシアムの集合的な知識のためのリポジトリです Unicode規格に含まれるCJK Unified Ideagra。を含む データをマッピングして、他のコード化文字セットと追加の文字セットへの変換を許可する Hanを使用するさまざまな言語のサポートを実装するのに役立つ情報 表意文字編集。
例については、ここに爱のデータです。 。
これは unihanデータベースの組織とコンテンツの説明です。データが参照している内容を理解するために必ず読んでください。
あなたが望む情報の場合は、 ZIPアーカイブをダウンロードできます。 このデータをすべて含まれています。
unihanデータベースにはBopomofo(Zhuyin)の発音がありませんが、ピンインの読みがあります。ピンインからZhuyinへの変換は簡単です。あなたのためにそれをすることができるオンラインツールがたくさんあります。
ライセンスの問題については、Unihanデータベースデータファイルに自由主義的な著作権通知を持っています。そのため、あなた自身のソフトウェアでそのデータを使用していかなる問題にも実行するべきではありません。
他のヒント
これは遅いエントリーの少しですが、私は昨年同じことを検索し、異なるデータセットの束に基づいて私自身の文字/ Bopomofoデータベースをコンパイルしました。私はそれを私自身で徹底的に呼び出すためにこのことに十分な仕事をしました。私がBopomofoによって並べ替えされたRubygemのその一部(私は私にデータベースのcolaltion設定を変更しないようにしました)