Domanda

C'è un rubino stemmer https://github.com/aurelian/ruby-stemmer , ma 1) non deriva verbi irregolari inglesi 2) non riesce a costruire estensioni native su Windows. Esiste un'alternativa che fissa almeno una parte dei problemi?

È stato utile?

Soluzione

Penso che si dovrebbe essere alla ricerca di un lemmatizer (che ha informazioni sulla morfologia e in grado di gestire le parole irregolari), piuttosto che uno Stemmer (che di solito solo lops le estremità delle parole). Vedere questa spiegazione a Manning, Raghavan, e prenotare on-line di Schütze il recupero delle informazioni.

Non ho provato, ma una rapida ricerca sono imbattuto in questo lemmatizer inglese per Ruby: elemma .

A comunemente usato analizzatore morfologico (non-Ruby) inglese che può fare lemmatizzazione è morpha .

Altri suggerimenti

Nessuno dei stemmer sono in grado di gestire i verbi irregolari in inglese.

Ho trovato questo mentre googling per ruby ??base NLP http: // mendicantbug.com/2009/09/13/nlp-resources-for-ruby/

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top