Question

Je veux utiliser Latent Semantic Analysis pour une petite application que je vais construire, mais je ne veux pas construire moi-même les matrices. (En partie parce que les documents que j'ai ne ferait pas une très bonne collection de formation, parce qu'ils sont un peu courte et hétérogène, et en partie parce que je viens de recevoir un nouvel ordinateur et je trouve qu'il est une chienne à installer l'algèbre linéaire et telle bibliothèques je aurais besoin.)

Y at-il « par défaut » / pré-construit implémentations LSA disponibles? Par exemple, des choses que je suis à la recherche comprennent:

  • défaut U, S, matrices V (par exemple, si D est une matrice terme-document à partir d'un certain ensemble de formation, alors D = USV ^ T est la décomposition en valeurs singulières), de sorte que compte tenu de tout vecteur de requête q, je peux utiliser ces matrices pour calculer la projection de LSA de q moi-même.
  • Certains algorithme de LSA boîte noire qui, étant donné un vecteur de requête q, renvoie la projection de LSA de q.
Était-ce utile?

La solution

Vous seriez probablement intéressé dans le cadre Gensim pour Python; notamment, il a un exemple sur la construction des matrices appropriées de Wikipédia en anglais .

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top