Question

Je suis en train d'analyser un texte et le diagramme il, comme vous une phrase. Je suis nouveau à NLTK et essaie de trouver quelque chose dans NLTK qui me aider à accomplir cette tâche. Jusqu'à présent, je l'ai vu nltk.ne_chunk et nltk.pos_tag. Je les trouve pas très utile et je ne suis pas en mesure de trouver une bonne documentation en ligne.

J'ai aussi essayé d'utiliser le LancasterStemmer, mais je ne comprends pas bien ce qu'il fait ou comment il doit être utilisé ou pourquoi il existe.

Quelqu'un peut-il s'il vous plaît aidez-moi avec ça? Je suis vraiment à une perte et d'obtenir assez frustré sans lumières de guidage.

Merci d'avance

Était-ce utile?

La solution

Ce que vous décrivez est en fait une tâche vraiment difficile, comme à la fin, si votre programme a réussi ou échoué est une mesure tout à fait subjective. Si tel est le cas, cela signifie généralement la construction d'un programme pour résoudre le problème est difficile. Il y a des gens qui sont payés pour travailler sur ces problèmes de genre dans les universités.

Si vous voulez avoir un coup de poignard à elle, je vous suggère d'essayer d'utiliser une sorte sur l'outil d'analyse lexicale automatique plutôt que d'essayer d'analyser manuellement et annoter, puis tirer parti de votre arbre d'analyse syntaxique. Habituellement parse-arbres représentent des analyses syntaxiques, à savoir la structure de la phrase. Vous d'autre part, sont plutôt préoccupés par l'analyse sémantique, à savoir ce que cela signifie -. Ou tout au moins si deux phrases sont semblables ou différents (qui est en fait un peu plus facile que ce que signifie quelque chose)

Vous pouvez regarder dans certains outils de résumé automatique impromptu. Ceux-ci tentent de marquer des phrases par la façon dont ils sont importants pour un morceau de texte et de filtrer les phrases qui sont moins importantes à un seuil déterminé. Non pas que cela vous aide vraiment beaucoup que vous avez encore le problème d'avoir besoin de la fusion des résumés.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top