Question

Je suis à la recherche d'un moyen donné un décompte de texte verbe anglais phrases qu'il contient dans le passé, présent et futur. Pour l'instant je suis en utilisant NLTK , faire un POS (Part-Of-Speech) le marquage, puis compter dire « VBD 'pour obtenir des temps du passé. Ce n'est pas assez précis, donc je suppose que je dois aller plus loin et de l'utilisation Chunking, puis analyser VP-blocs pour des motifs spécifiques tendus. Y at-il existant qui fait cela? Toute autre lecture qui pourrait être utile? Le livre NLTK se concentre principalement sur NP-morceaux, et je peut trouver assez peu d'informations sur VP-blocs.

Était-ce utile?

La solution

Toi réponse exacte dépend de Chunker vous avez l'intention d'utiliser, mais la liste compréhensions vous prendra un long chemin. Cela vous obtient le nombre de verbe phrases en utilisant un chunker inexistant.

len([phrase for phrase in nltk.Chunker(sentence) if phrase[1] == 'VP'])

Vous pouvez adopter une approche plus fine grain pour détecter le nombre de tenses.

Autres conseils

Vous pouvez le faire soit avec le Berkeley Parser ou Stanford Parser . Mais je ne sais pas si l'interface il y a un Python disponible pour les deux.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top