Frage

Ich versuche, einen Text zu analysieren und es Diagramm, wie würden Sie einen Satz. Ich bin neu in NLTK und ich versuche, etwas in NLTK zu finden, die mir dies erreichen helfen. Bisher habe ich nltk.ne_chunk und nltk.pos_tag gesehen. Ich finde sie nicht sehr hilfreich sein und ich bin nicht in der Lage jede gute Online-Dokumentation zu finden.

Ich habe auch versucht, die LancasterStemmer zu verwenden, aber ich verstehe nicht ganz, was es tut, oder wie sie verwendet werden sollen, oder warum es existiert.

Kann jemand bitte helfen Sie mir mit diesem? Ich bin wirklich ratlos und immer ziemlich frustriert ohne Leitsterne.

Vielen Dank im Voraus

War es hilfreich?

Lösung

Was Sie beschreiben, ist eigentlich eine wirklich schwierige Aufgabe, wie am Ende, ob das Programm erfolgreich ist oder fehlgeschlagen ist ein ganz subjektives Maß. Wenn dies der Fall ist, bedeutet dies in der Regel ein Programm konstruiert das Problem ist schwer zu lösen. Es gibt Menschen, die dafür bezahlt auf diese Art Probleme in Universitäten zu arbeiten.

Wenn Sie es einen Stich haben wollte, würde ich vorschlagen, für den Versuch, eine Art zu verwenden, um auf automatisierte lexikalische Analyse-Tool anstatt zu versuchen, manuell zu analysieren und mit Anmerkungen versehen, und dann Parse-Baum zu nutzen. Normalerweise Parsebäume syntaktische Analysen darstellen, dh die Struktur des Satzes. Sie befinden sich auf der anderen Seite betroffen sind eher mit der semantischen Analyse, das heißt, was es bedeutet -. Oder zumindest, ob zwei Sätze gleich oder verschieden sind (was eigentlich ein bisschen leichter als das, was etwas bedeutet)

Sie könnten einige Blick in off-the-shelf automatische Verdichtungswerkzeuge. Diese versuchen, Sätze zu zählen, indem sie, wie wichtig sie sind auf ein Stück Text und auszufiltern Sätze, die weniger wichtig sind als eine bestimmte Schwelle. Nicht, dass dies hilft Ihnen wirklich so viel, wie Sie immer noch das Problem des Müssens dem Merge die Zusammenfassungen haben.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top