عد الأفعال والأسماء وأجزاء أخرى من الكلام مع Python's NLTK
-
12-12-2019 - |
سؤال
لدي نصوص متعددة وأرغب في إنشاء ملفات تعريف لهم بناء على استخدامها لأجزاء مختلفة من الكلام، مثل الأسماء والأفعال.في الأساس، أحتاج إلى حساب عدد المرات التي يستخدم فيها كل جزء من الكلام.
قد وضع علامة على النص ولكن لست متأكدا من كيفية الذهاب إلى أبعد من ذلك: giveacodicetagpre.
كيف يمكنني حفظ التهم لكل جزء من الكلام في متغير؟
المحلول
تمنحك طريقة pos_tag
قائمة من أزواج (رمز مميز، علامة):
giveacodicetagpre.
إذا كنت تستخدم Python 2.7 أو إصدار أحدث، فيمكنك القيام بذلك ببساطة مع: giveacodicetagpre.
لتطبيع التهم (مما يتيح لك نسبة كل منها) القيام به: giveacodicetagpre.
لاحظ أنه في الإصدارات القديمة من Python، سيتعين عليك تطبيق GransoLacetagCode بنفسك: giveacodicetagpre.
لا تنتمي إلى StackOverflow