Frage

Ich habe eine Liste von Wörtern und ich möchte es filtern, nach unten, so dass ich nur die Substantive aus dieser Liste von Wörtern (mit Java). Um dies zu tun ich für eine einfache Möglichkeit suchen, eine Datenbank von Wörtern für ihre Art abzufragen.

Meine Frage ist, weiß jemand von einem freien, leicht Wort-Lookup-API, die mich ermöglichen würde, die Klasse ein Wort zu finden, die nicht unbedingt seine semantische Definition.

Danke!

Ben.

EDIT: Mit Klasse des Wortes bedeuten, dass ich 'part-of-speech' Vielen Dank für diese Aufklärung

War es hilfreich?

Lösung

Worttyp? Wie Verb, Substantiv, Adjektiv, etc? Wenn ja, könnten Sie in der Frage führen, dass einige Wörter in mehr als einer Weise verwendet werden kann. Zum Beispiel: „Können Sie mir handeln diese Karte?“, „Das ist ein schlechter Handel ist.“

Siehe dieses Thema für einige Vorschläge.

Hier finden Sie aktuelle dies auch , scheint, wie es genau tun könnte, was Sie‘ re suchen.

Andere Tipps

Ich denke, was Sie suchen die Part-of-Speech ist (POS) eines Wortes. In allgemein, dass außer im Rahmen eines Satzes zu bestimmen, wird nicht möglich sein. Es gibt viele Wörter, die mehrere verschiedene mögliche Teile von Sprache haben kann (zum Beispiel ‚Bank‘ kann als Verb oder Substantiv verwendet werden).

Sie könnten einen POS-Tagger verwenden, um die gewünschten Informationen zu erhalten. Allerdings ist der folgende Teil of-speech Tagger annehmen annimmt, dass Sie Worte in einem gut strukturierten englischen Satz sind Tagging ...

  • Die OpenNLP Java-Bibliotheken sind in der Regel sehr gut und unter der LGPL veröffentlicht. Es ist ein Teil-of-Speech-Tagger für Englisch und ein paar andere in der Distribution enthalten Sprachen. Gehen Sie einfach auf die Projektseite, um das Glas zu bekommen (und vergessen Sie nicht die Modelle auch zum Download).

  • Es gibt auch den Stanford part-of-speech-Tagger , in Java unter der GPL geschrieben. Ich habe keine direkte Erfahrung mit dieser Bibliothek hatte, aber das Stanford NLP Labor ist in der Regel ziemlich genial.

Die Abfrage einer Datenbank von Wörtern, um das Problem führen wird, dass Ben S. erwähnt, z.B. führen (v. den Weg zu zeigen) ist oder Blei (n. Pb). Wenn Sie einige Zeit auf das Problem verbringen wollen, schauen Teil Tagging Rede. Es gibt einige gute Informationen in andere SO Thread .

Für Englisch, könnten Sie WordNet verwenden, um mit einem der verfügbaren Java-APIs finden lexikalische Kategorie ein Wort (die in NLP am häufigsten die Teil der Sprache genannt wird ). Mit Hilfe eines speziellen POS-Tagger eine weitere Option wäre.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top