عد الأفعال والأسماء وأجزاء أخرى من الكلام مع Python's NLTK

https://stackoverflow.com//questions/10674832

12-12-2019
|

سؤال

لدي نصوص متعددة وأرغب في إنشاء ملفات تعريف لهم بناء على استخدامها لأجزاء مختلفة من الكلام، مثل الأسماء والأفعال.في الأساس، أحتاج إلى حساب عدد المرات التي يستخدم فيها كل جزء من الكلام.

قد وضع علامة على النص ولكن لست متأكدا من كيفية الذهاب إلى أبعد من ذلك: giveacodicetagpre.

كيف يمكنني حفظ التهم لكل جزء من الكلام في متغير؟

المحلول

تمنحك طريقة pos_tag قائمة من أزواج (رمز مميز، علامة): giveacodicetagpre.

إذا كنت تستخدم Python 2.7 أو إصدار أحدث، فيمكنك القيام بذلك ببساطة مع: giveacodicetagpre.

لتطبيع التهم (مما يتيح لك نسبة كل منها) القيام به: giveacodicetagpre.

لاحظ أنه في الإصدارات القديمة من Python، سيتعين عليك تطبيق GransoLacetagCode بنفسك: giveacodicetagpre.

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow