Question

Je cherche un jeu de données avec toutes les prononciations de Mandarin de personnage chinois à Bopomofo et / ou Pinyin.En outre, j'ai besoin de jeux de données open source que je peux copier dans mes propres bases de code.

Était-ce utile?

La solution

On dirait que vous recherchez peut-être la base de données Unihan. La base de données Unihan est maintenue par le consortium Unicode.

La base de données Unihan est le référentiel de la connaissance collective du consortium Unicode concernant les idéognes unifiées CJK contenues dans la norme UNICODE. Il contient Données de mappage pour permettre la conversion vers et depuis d'autres ensembles de caractères codés et d'autres informations pour aider à mettre en œuvre le support des différentes langues qui utilisent le Han Script idéographique.

Pour un exemple, voici Les données de 爱 .

Voici La description de l'organisation et du contenu de la base de données UNIHAN. Assurez-vous de lire cela pour comprendre ce que les données font référence à.

S'il s'agit des informations que vous souhaitez, vous pouvez Télécharger l'archive ZIP qui contient toutes ces données.

La base de données Unihan n'a pas de prononciations Bopomofo (Zhuyin), mais il a des lectures de pinyin. La conversion de pinyin en zhuyin est simple; Il y a beaucoup d'outils en ligne qui peuvent le faire pour vous.

En ce qui concerne les problèmes de licence, les fichiers de données de base de données UNIHAN ont Un avis de copyright libéral . Donc, vous ne devriez pas rencontrer de problèmes en utilisant ces données dans votre propre logiciel.

Autres conseils

Ceci est un peu d'entrée tardive, mais je cherchais la même chose l'année dernière et j'ai fini par compiler ma propre base de données de caractère / BOPOMOFO basée sur un tas de différents ensembles de données.J'ai mis suffisamment de travail dans cette chose pour l'appeler complètement la mienne, alors vous devriez vérifier!sa partie d'un rubygem que j'ai fait de trier par Bopomofo (j'ai eu un système qui ne me permettrait pas de changer les paramètres de colaltion de base de données) https://github.com/nallan/ab-chi

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top