سؤال

أنا أبحث عن مجموعات بيانات مع كل الأحرف الصينية نطق Mandarin في Bopomofo و / أو Pinyin.أيضا، أحتاج إلى مجموعات بيانات مفتوحة المصدر التي يمكنني نسخها في قواعد الرمز الخاصة بي.

هل كانت مفيدة؟

المحلول

يبدو وكأنك قد تبحث عن قاعدة بيانات Unihan. يتم الحفاظ على قاعدة بيانات UniHan من قبل اتحاد يونيكود.

قاعدة بيانات Unihan هي مستودع المعرفة الجماعية لاتحاد يونيكود فيما يتعلق بالأيديوشروج الموحدة CJK الواردة في معيار Unicode. أنه يحتوي على تعيين البيانات للسماح بالتحويل من وإلى مجموعات الأحرف المشفرة الأخرى معلومات للمساعدة في تنفيذ الدعم لغات مختلفة تستخدم هان البرنامج النصي ideographic.

للحصول على مثال، هنا البيانات الخاصة ب 爱 .

هنا هو وصف المنظمة والمحتوى قاعدة بيانات UNIHAN. تأكد من قراءة ذلك لفهم ما تشير إليه البيانات إليه.

إذا كانت هذه هي المعلومات التي تريدها، يمكنك تحميل الرمز البريدي أرشيف يحتوي على كل هذه البيانات.

لا تحتوي قاعدة بيانات Unihs على نطق Bopomofo (Zhuyin)، ولكن لديها قراءات بينين. تحويل من بينيين إلى Zhuyin بسيط؛ هناك الكثير من الأدوات عبر الإنترنت التي يمكن أن تفعل ذلك من أجلك.

أما بالنسبة لقضايا الترخيص، فإن ملفات بيانات قاعدة بيانات Unihan لديها إشعار حقوق الطبع والنشر الليبرالي . لذلك، يجب أن لا تعمل في أي مشاكل باستخدام تلك البيانات في البرنامج الخاص بك.

نصائح أخرى

هذا هو القليل من الإدخال المتأخر لكنني كنت أبحث عن نفس الشيء في العام الماضي وانتهى الأمر بتجميع قاعدة بيانات شخصيتي / Bopomofo الخاصة بي بناء على مجموعة من مجموعات البيانات المختلفة.لقد وضعت ما يكفي من العمل في هذا الشيء أن نسميها بدقة بلدي على الرغم من أنه يجب عليك التحقق من ذلك!جزء من Rubygem الذي قمت به للفرز حسب Bopomofo (كان لدي نظام لن يسمح لي بتغيير إعدادات Colaltion قاعدة البيانات) https://github.com/nallan/ab-chi

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top