Pregunta

¿Conoce alguna base de datos Lemmatizer lo suficientemente grande que devuelva el resultado correcto para las siguientes palabras de muestra:

geese: goose
plantes: //not found

El analizador morfológico de WordNet no es suficiente, ya que proporciona los siguientes resultados incorrectos:

geese: //not found
plantes: plant
¿Fue útil?

Solución

Morfador Parece ser mejor en esto, pero todavía encuentra el resultado incorrecto de las "plantas"

plantes: plante
geese: goose

Tal vez le gustaría usar Morphadorner para hacer la lemmatización y luego verificar sus resultados contra WordNet. Puedes usar la API de WordNet para realizar buscas sin que Primero realización de lemmatización llamando findtheinfo_ds. Esto le permite usar un lemmatizer como Morphadorner primero. (Si quisiera usar el Lemmaitzer, necesitaría llamar morph por separado y llamar findtheinfo_ds en los lemas que regresó).

Por otro lado, solo pasé unos 5 segundos mirando a Morphadorner para este propósito, y puede haber una manera de eliminar la respuesta incorrecta de "plantas" sin tener que usar ningún otro recurso externo.

Otros consejos

Érase una vez, alguien sugirió Morha Para mí, pero no lo he usado, así que no sé si lo hace mejor en esto que WordNet.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top