Question

J'ai besoin d'un bon algorithme de mise au point pour un projet sur lequel je travaille. Il a été suggéré que je regarde le Porter Stemmer. Lorsque j’ai vérifié la page du Porter, j’ai constaté qu’il était devenu obsolète au profit de "Snowball". stemmer.

J'ai besoin d'un bon coupeur, mais je ne peux pas vraiment passer beaucoup de temps à mettre en œuvre (ou à optimiser) le mien. Quel est le meilleur "étalon", un stemmer disponible gratuitement? Y at-il des souches non-libres disponibles pour un prix raisonnable? Ou alors, la balle de neige est-elle mon meilleur pari?

Était-ce utile?

La solution

Le Porter2 est celui que j'ai choisi. Il semblait que le porteur était la norme, mais lorsque j'ai trouvé la page de l'auteur, il a recommandé l'option "Snowball (Porter2)". stemmer. Il existe un lien vers le port C sur cette page.

Autres conseils

Cela dépend vraiment de la manière dont vous envisagez de l'appliquer. La boîte à outils en langage naturel ( http://nltk.sourceforge.net ) contient un certain nombre de convertisseurs de code qui implémentent devrait être capable de gérer la plupart des applications. Je préfère le stemming Morphy.

Bien sûr, il est disponible en Python. Par conséquent, si vous utilisez une autre langue, vous pouvez toujours consulter le code pour obtenir l’algorithme et le transférer dans la langue de votre choix. Python est très lisible.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top