ما هو المختنق الافتراضي لأجهزة Toolkit NLTK في بيثون؟

StackOverflow https://stackoverflow.com/questions/1687510

  •  18-09-2019
  •  | 
  •  

سؤال

أنا أستخدم وضع العلامات على نقاط البيع الافتراضية والتكامل الافتراضي .. ويبدو كافية. أريد منتخبهم الافتراضي أيضا.

أنا أقرأ كتاب مجموعة أدوات NLTK، لكنه لا يبدو أن لديهم مكتنف افتراضي؟

هل كانت مفيدة؟

المحلول

يمكنك الخروج من الصندوق المسمى كيان Chunking مع طريقة nltk.ne_chunk (). يستغرق الأمر قائمة نقاط البيع الموسومة:

nltk.ne_chunk([('Barack', 'NNP'), ('Obama', 'NNP'), ('lives', 'NNS'), ('in', 'IN'), ('Washington', 'NNP')])

النتائج في:

Tree('S', [Tree('PERSON', [('Barack', 'NNP')]), Tree('ORGANIZATION', [('Obama', 'NNP')]), ('lives', 'NNS'), ('in', 'IN'), Tree('GPE', [('Washington', 'NNP')])])

وهو يحدد باراك كشخص، ولكن أوباما كمؤسسة. لذلك، ليست مثالية.

نصائح أخرى

لم أستطع العثور على محلل مكتنز / ضحل افتراضي إما. على الرغم من أن الكتاب يصف كيفية بناء وتدريب واحد بميزات مثال. الخروج مع ميزات إضافية للحصول على أداء جيد لا ينبغي أن تكون صعبة للغاية.

انظر قسم الفصل 7 التدريب المعتمد على المصنف.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top