احصل على احتمالات نقاط البيع من أداة سطر أوامر Wordnet

StackOverflow https://stackoverflow.com/questions/6388343

  •  29-10-2019
  •  | 
  •  

سؤال

أكتب بعض التجارب مع وصول Ruby إلى wordnet من خلال أداة سطر أوامر wn لأنني تخليت عن تشغيل جوهرة wordnet.

أريد أن أكون قادرًا على البحث عن ترددات الحواس ، حتى أتمكن في النهاية من حساب احتمال أن تكون كلمة معينة اسمًا / صفة / فعل / ظرف.

لقد جربت التوثيق ولكنه ليس دائمًا بهذه الوضوح

هل هذا ممكن بدون استخدام أداة wn فقط؟وهل أنا أكتب بالتفكير أن wordnet تتضمن هذه المعلومات؟

هل كانت مفيدة؟

المحلول

بقدر ما أستطيع أن أقول ، فإنه لا يشمل الترددات في حد ذاتها ، على الرغم من أن المزامنة مرتبة من الأكثر تكرارًا إلى الأقل تكرارًا في نتائج الإرجاع.

يمكنك الحصول على الترددات الفعلية بعدة طرق.ربما يكون الأكثر موثوقية هو استخدام مجموعة نقاط البيع الموسومة مثل Penn TreeBank ، ثم احسب القيم بنفسك.لسوء الحظ ، يكون الحصول على نسخة مجانية من ذلك أمرًا صعبًا إذا لم تكن في جامعة.هناك خيار آخر يتمثل في بناء مجموعة النصوص الخاصة بك (ربما من المدونات ، أو كتب Project Gutenberg ، أو Wikipedia ، أو أي شيء آخر) ، ثم قم بتشغيل أداة تحديد نقاط البيع (POS) عليها ثم حساب الترددات من ذلك.من الواضح أن هذه الطريقة ستكون منحرفة ، لكنها أسهل بكثير من وضع علامات على مجموعة ما يدويًا.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top