Frage

Kennen Sie jede Lemmatizer -Datenbank ausreichend, die das richtige Ergebnis für folgende Beispielwörter zurückgibt:

geese: goose
plantes: //not found

Der morphologische Analysator von WordNet ist nicht ausreichend, da er die folgenden falschen Ergebnisse liefert:

geese: //not found
plantes: plant
War es hilfreich?

Lösung

Morphadorner Es scheint besser zu sein, aber es findet immer noch das falsche Ergebnis für "Pflanzen"

plantes: plante
geese: goose

Vielleicht möchten Sie Morphadorner verwenden, um die Lemmatisierung durchzuführen und dann seine Ergebnisse gegen WordNet zu überprüfen. Sie können die WordNet -API verwenden, um Lookups auszuführen ohne Erste Durchführung der Lemmatisierung durch Anrufe findtheinfo_ds. Auf diese Weise können Sie zuerst einen Lemmatizer wie Morphadorner verwenden. (Wenn Sie den Lemmitzer verwenden möchten, müssten Sie anrufen morph getrennt und rufen Sie an findtheinfo_ds Auf den Lemmas, die es zurückgekehrt hat.)

Andererseits habe ich nur etwa 5 Sekunden damit verbracht, Morphadorner zu diesem Zweck zu betrachten, und es gibt möglicherweise eine Möglichkeit, die falsche "Pflanzen" zu beseitigen, ohne andere externe Ressource zu verwenden.

Andere Tipps

Es war einmal, schlug jemand vor Morpha Für mich, aber ich habe es nicht benutzt, also weiß ich nicht, ob es dies besser macht als WordNet.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top