Bases de datos de lemmatizadores ingleses?
-
26-10-2019 - |
Pregunta
¿Conoce alguna base de datos Lemmatizer lo suficientemente grande que devuelva el resultado correcto para las siguientes palabras de muestra:
geese: goose
plantes: //not found
El analizador morfológico de WordNet no es suficiente, ya que proporciona los siguientes resultados incorrectos:
geese: //not found
plantes: plant
Solución
Morfador Parece ser mejor en esto, pero todavía encuentra el resultado incorrecto de las "plantas"
plantes: plante
geese: goose
Tal vez le gustaría usar Morphadorner para hacer la lemmatización y luego verificar sus resultados contra WordNet. Puedes usar la API de WordNet para realizar buscas sin que Primero realización de lemmatización llamando findtheinfo_ds
. Esto le permite usar un lemmatizer como Morphadorner primero. (Si quisiera usar el Lemmaitzer, necesitaría llamar morph
por separado y llamar findtheinfo_ds
en los lemas que regresó).
Por otro lado, solo pasé unos 5 segundos mirando a Morphadorner para este propósito, y puede haber una manera de eliminar la respuesta incorrecta de "plantas" sin tener que usar ningún otro recurso externo.
Otros consejos
Érase una vez, alguien sugirió Morha Para mí, pero no lo he usado, así que no sé si lo hace mejor en esto que WordNet.