سؤال

أعجبت جدا مع OpenCalais النظام.إنه (هو/له) خدمة ويب حيث يمكنك إرسال النص الخاص بك ، يفعلوا ذلك ، ثم يتم توفير لكم مع سلسلة من تصنيف (قوات الدفاع الرواندية تمكين) فئة المستند الخاص بك ينتمي إلى.

ولكن - في هذه اللحظة - اللغة الإنجليزية هي فقط لغة معتمدة.

هل تعرف من الأنظمة المشابهة التي مقبض متعدد اللغات الوثائق ؟ (أنا مهتم ن الإيطالية ، ولكن متعدد اللغات هو زائد بالطبع)

هل كانت مفيدة؟

المحلول

أباتشي Stanbol يمكن تحليل النصوص في العديد من اللغات المختلفة.حتى الآن اللغات التالية معتمدة (الدقة و أذكر القيم قد تختلف حسب اللغة):

  • الإنجليزية ،
  • 中文 (الصينية) ،
  • الأسبانية (الإسبانية) ،
  • Русский (الروسية) ،
  • البرتغالية (البرتغالية) ،
  • الألمانية (ألمانيا),
  • الإيطالية (الإيطالية),
  • هولندي (الهولندية) ،
  • Svenska (السويدية) ،
  • Dansk (الدنماركية) ،
  • English (العربية) ،
  • עברית (العبرية),
  • 日本語 (اليابانية).

تحليل سيعود اكتشف الكيانات.تحليل تنسيق الإخراج يمكن أن يكون:

  • JSON-LD ،
  • قوات الدفاع الرواندية/XML ،
  • قوات الدفاع الرواندية/JSON ،
  • السلاحف ،
  • N-يتضاعف ثلاث مرات.

الكيانات أو علامات من النصوص يمكن زيادة مصممة وفقا لتكوين النظام.من الناحية المثالية أي عرف المفردات يمكن توصيله إلى النظام.

وهناك زوجين من العرض نهاية نقاط:

غير متأكد ما إذا كان كل ما سبق هي اللغات المدعومة في السالفة على النقاط النهائية.

RedLink GmbH سوف توفر الخدمات السحابية على أساس أباتشي Stanbol والبرامج ذات الصلة.

على WordLift المساعد وورد يوفر بالفعل تحليل النص في وورد كل السالفة اللغات (حاليا في مرحلة الاختبار).يمكنك محاولة تثبيت المكونات في وورد و تقديم محتويات نصية في وظيفة الجسم.

يمكنك أيضا الاشتراك والكتابة إلى أباتشي Stanbol القائمة البريدية لطلبات محددة أو المعلومات.

نصائح أخرى

وOpenCalais يدعم الفوقية على حد سواء الفرنسية والإسبانية علامات للكيانات. سيتم تمديد مجموعة من الكيانات في الإصدارات المستقبلية. راجع وثائق على شبكة الإنترنت على http://www.opencalais.com/documentation/calais -web الخدمة-المعهد

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top