Pregunta

Hay un rubí despalilladora https://github.com/aurelian/ruby-stemmer , pero 1) no se deriva inglés verbos irregulares 2) falla para construir extensiones nativas en Windows. ¿Hay una alternativa que fija al menos uno de los problemas?

¿Fue útil?

Solución

creo que debe ser la búsqueda de un lematizador (que tiene información sobre la morfología y puede manejar las palabras irregulares) en lugar de un analizador lingüístico (que por lo general sólo lops los extremos de las palabras). Ver este explicación en Manning, Raghavan, y el libro en línea de Schütze en la recuperación de información.

Yo no lo he probado, pero una búsqueda rápida encontré con este lematizador Inglés para Ruby: elemma .

A comúnmente utilizado analizador morfológico (no rubí) Inglés que puede hacer lematización es morpha .

Otros consejos

Ninguno de los analizadores lingüísticos son capaces de manejar los verbos irregulares en Inglés.

He encontrado este tiempo buscando en Google para Ruby basado PNL http: // mendicantbug.com/2009/09/13/nlp-resources-for-ruby/

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top