Frage

Ich versuche, Porter -Stemming -Algorithmus zu implementieren, aber ich habe Schwierigkeiten, diesen Punkt zu verstehen

Schritt 1c

(*v*) Y -> I                    happy        ->  happi
                                sky          ->  sky

Ist das nicht das Gegenteil von dem, was wir tun wollen, warum konvertiert der Algorithim das Y in I.

Für den vollständigen Algorithmus hier http://tartarus.org/~martin/porterstemmer/def.txt

Vielen Dank

War es hilfreich?

Lösung

Der Porter Stemmer und andere Stammalgorithmen Kehren Sie nicht immer Wörter zurück; Sie kehren zurück Wortstämme. Das Ziel ist, dass verwandte Wörter den gleichen Stamm haben sollten. Solange "Glück", "glücklich" und "glücklich" auf denselben Stamm reduziert, macht Ihr Stemmer seinen Job, auch wenn der Stamm kein echtes Wort ist.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top