Frage

Ich habe viele verschiedene Korpora für die Verarbeitung natürlicher Sprache verwendet und nach einem Korpus gesucht, der mit WordNet -Word -Sinnen kommentiert wurde.

Ich verstehe, dass es wahrscheinlich keinen großen Korpus mit diesen Informationen gibt, da der Korpus manuell aufgebaut werden muss, aber es muss etwas geben, aus dem man sich entfernen muss.

Auch wenn es keinen Korpus gibt, gibt es zumindest eine sinnvolle ngram ist)?

War es hilfreich?

Lösung

Drei prominente Korpora, die für WordNet kommentiert wurden:

Andere Tipps

Manche der Senseval (jetzt Semeval) Daten werden mit WordNet kommentiert.

Sie können Senseval2 verwenden, für Java gibt es ein Semcor -Format und (Jsemcor -API) und auch Senseval3. Diese beiden Korpus werden zur Disambiguation von Wortsinn verwendet.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top