Question

Y at-il implémentation open source de LSI en Java? Je veux utiliser cette bibliothèque pour mon projet. Je l'ai vu JLSI mais il met en œuvre un autre modèle de LSI. Je veux un modèle standard.

Était-ce utile?

La solution

Avez-vous envisagé LDA (Latent Dirichlet Allocation)? Je n'ai pas vraiment non plus, mais j'ai rencontré le même problème avec LSI récemment (brevets). D'après ce que je comprends LDA est une technique apparentée / plus puissant. http://en.wikipedia.org/wiki/Latent_Dirichlet_allocation a apparemment des liens vers Open- implémentations source.

Autres conseils

Une recherche google pour java LSI conduit à une question similaire qui recommande SemanticVectors. Un paquet construit sur Lucene qui est « similaire » à LSI. Je ne sais pas si elle est plus proche que la mise en œuvre JLSI.

Ce fil mentionne également que LSI est breveté et il n'y a pas beaucoup de mises en œuvre de celui-ci. Donc, si vous avez besoin d'une implémentation standard, vous devrez peut-être utiliser une autre langue que java.

Le Package S-Space a une version open source de LSA , avec des liaisons pour les vecteurs de document LSI. (Les deux approches fonctionnent sur la même matrice terme-document et sont équivalents, sauf dans la sortie.) Il est une approche assez évolutive qui utilise la mince SVD. Je l'ai utilisé pour exécuter LSI sur tous Wikipédia sans problème (après avoir supprimé les termes peu fréquents avec moins de 5 occurrences).

Comme Scott Ray mentionné, le paquet SemanticVectors dispose également d'une bonne mise en œuvre LSI qui a récemment commencé à utiliser la même mince SVD (SVDLIBJ), de sorte que vous pouvez vérifier que comme si vous aviez pas avant.

une recherche google pour les outils de la PNL offrent cette glisse qui je pense aide ...

Je crois que LSA / LSI a été breveté en 1989, ce qui signifie que le brevet aurait vient d'expirer. Espérons que nous verrons quelques belles applications open source bientôt.

Avez-vous essayé le paquet vecteur sémantique?

http://code.google.com/p/semanticvectors/

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top