Question

Je suis en train de mettre en œuvre porter algorithme de lemmatisation mais je suis bloqué à ce point:

  

Etape 1b

(m>0) EED -> EE                    feed      ->  feed
                                   agreed    ->  agree
(*v*) ED  ->                       plastered ->  plaster
                                   bled      ->  bled
(*v*) ING ->                       motoring  ->  motor
                                   sing      ->  sing

est pas le m d'alimentation égal à 1? alimentation >> [c] vvc [] >> [c] vc [].

Si c'était alors pourquoi ne pas lui à utiliser des aliments frais Je sais qu'il est mal, peut-on effacer cela?

vous pouvez vérifier la algorithim originale ici http://tartarus.org/~martin/PorterStemmer /def.txt

Merci

Était-ce utile?

La solution

m de « nourrir » est en effet 1. Cependant, vous devez relire attentivement le document. Le m de la condition fait référence à la mesure de la tige, qui est ce que vous devez calculer après le remplacement. Dans votre cas, pour vérifier si feed -> fee est valide, vous calculez m (payant) = 0, donc vous ne faites pas le remplacement.

Merci aussi pour l'algorithme! Il était intéressant!

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top