Englisch Lemmatizer -Datenbanken?
-
26-10-2019 - |
Frage
Kennen Sie jede Lemmatizer -Datenbank ausreichend, die das richtige Ergebnis für folgende Beispielwörter zurückgibt:
geese: goose
plantes: //not found
Der morphologische Analysator von WordNet ist nicht ausreichend, da er die folgenden falschen Ergebnisse liefert:
geese: //not found
plantes: plant
Lösung
Morphadorner Es scheint besser zu sein, aber es findet immer noch das falsche Ergebnis für "Pflanzen"
plantes: plante
geese: goose
Vielleicht möchten Sie Morphadorner verwenden, um die Lemmatisierung durchzuführen und dann seine Ergebnisse gegen WordNet zu überprüfen. Sie können die WordNet -API verwenden, um Lookups auszuführen ohne Erste Durchführung der Lemmatisierung durch Anrufe findtheinfo_ds
. Auf diese Weise können Sie zuerst einen Lemmatizer wie Morphadorner verwenden. (Wenn Sie den Lemmitzer verwenden möchten, müssten Sie anrufen morph
getrennt und rufen Sie an findtheinfo_ds
Auf den Lemmas, die es zurückgekehrt hat.)
Andererseits habe ich nur etwa 5 Sekunden damit verbracht, Morphadorner zu diesem Zweck zu betrachten, und es gibt möglicherweise eine Möglichkeit, die falsche "Pflanzen" zu beseitigen, ohne andere externe Ressource zu verwenden.
Andere Tipps
Es war einmal, schlug jemand vor Morpha Für mich, aber ich habe es nicht benutzt, also weiß ich nicht, ob es dies besser macht als WordNet.