سؤال

أنا أبحث عن لعبة بسيطة ولكنها "جيدة بما فيه الكفاية" اسمه الكيان الاعتراف مكتبة (و القاموس) جافا, أنا أبحث في عملية رسائل البريد الإلكتروني و الوثائق و استخراج بعض "المعلومات الأساسية" مثل:أسماء الأماكن عنوان التواريخ

كنت أنظر حولي و الأكثر يبدو أن يكون على الجانب الثقيلة و كامل البرمجة اللغوية العصبية نوع من المشاريع.

أي التوصيات ؟

هل كانت مفيدة؟

المحلول 2

وراجع للشغل، وأنا مؤخرا ركض عبر OpenCalais حيث يبدو أن havethe وظيفة كنت أبحث بعد.

نصائح أخرى

قد ترغب في إلقاء نظرة على واحدة من بلادي في وقت سابق إجابات إلى مشكلة مماثلة.

بخلاف أن معظم أخف نير أنظمة تعتمد كثيرا على نطاق استخدامها.سوف تجد الكثير من الأدوات والأوراق حول الطب الحيوي نير الأنظمة ، على سبيل المثال.بالإضافة إلى مشاركتي السابقة (التي تحتوي بالفعل على بلدي التوصية الرئيسية إذا كنت تريد أن تفعل NER) ، وإليك بعض الأدوات التي قد ترغب في النظر في:

  • على ستانفورد CER-NER
  • على Postech الطبية الحيوية نير النظام إذا كنت مهتما في هذا المجال
  • OpenCalais يبدو أن النظام التجاري.هناك UIMA wrappers OpenCalais ولكن يبدو أنها مؤرخة.كما يوجد قاموس على أساس سياق مخطط الحواشي على UIMA التي قد تساعدك على الخروج.تكون على علم بأن UIMA يعني حمل كبير في منحنى التعلم ;-)
  • OpenNLP أيضا NER أداة.
  • Balie لا NER ، أيضا ، من بين أمور أخرى.
  • أبنير لا نا ، ولكن مرة أخرى تركز على مجال الطب الحيوي.
  • على جولي أدوات المختبر من جامعة يينا في ألمانيا أيضا لا NER.لديهم مستقل الإصدارات UIMA تحليل محركات.

واحدة إضافية ملاحظة:أنك لن تحصل على بعيدا دون عملية تحويل البيانات إلى رموز على المدخلات.عملية تحويل البيانات إلى رموز اللغة الطبيعية هو قليلا غير تافهة ، لهذا السبب أقترح عليك استخدام الأدوات التي لا سواء بالنسبة لك.

وقد ترغب في محاولة خيمياء API كذلك. على غرار فتح كاليه.

لNLP النحوي يمكنك التحقق http://code.google.com/p/graph -expression / و http://gate.ac.uk/

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top