عد الأفعال والأسماء وأجزاء أخرى من الكلام مع Python's NLTK

StackOverflow https://stackoverflow.com//questions/10674832

سؤال

لدي نصوص متعددة وأرغب في إنشاء ملفات تعريف لهم بناء على استخدامها لأجزاء مختلفة من الكلام، مثل الأسماء والأفعال.في الأساس، أحتاج إلى حساب عدد المرات التي يستخدم فيها كل جزء من الكلام.

قد وضع علامة على النص ولكن لست متأكدا من كيفية الذهاب إلى أبعد من ذلك: giveacodicetagpre.

كيف يمكنني حفظ التهم لكل جزء من الكلام في متغير؟

هل كانت مفيدة؟

المحلول

تمنحك طريقة pos_tag قائمة من أزواج (رمز مميز، علامة): giveacodicetagpre.

إذا كنت تستخدم Python 2.7 أو إصدار أحدث، فيمكنك القيام بذلك ببساطة مع: giveacodicetagpre.

لتطبيع التهم (مما يتيح لك نسبة كل منها) القيام به: giveacodicetagpre.

لاحظ أنه في الإصدارات القديمة من Python، سيتعين عليك تطبيق GransoLacetagCode بنفسك: giveacodicetagpre.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top