Frage

Ich möchte Latent Semantic Analysis für eine kleine Anwendung verwenden Ich baue, aber ich will nicht die Matrizen selbst aufzubauen. (Teilweise, weil die Dokumente, die ich hätte nicht eine sehr gute Ausbildung Kollektion machen, weil sie irgendwie kurz sind und heterogen, und zum Teil, weil ich habe gerade einen neuen Computer und ich finde es eine Hündin die lineare Algebra zu installieren und so Bibliotheken, die ich benötigen würde.)

Gibt es irgendwelche "default" / Vorgefertigte LSA-Implementierungen zur Verfügung? Zum Beispiel Dinge, die ich bin auf der Suche nach sind:

  • Standard-U, S, V Matrizen (dh wenn D ein Term-Dokument-Matrix von einem Trainingssatz ist, dann ist D = USV ^ T die Singulärwertzerlegung), so dass jede Abfragevektor q gegeben, kann ich diese Matrizen die LSA-Projektion von q selbst zu berechnen.
  • Einige Black-Box-LSA-Algorithmus, dass eine Abfrage Vektor q gegeben, gibt die LSA Projektion von q.
War es hilfreich?

Lösung

Sie würden wahrscheinlich in der GENSIM Rahmen für Python; vor allem hat es ein Beispiel auf die entsprechenden Matrizen aus dem Englischen Wikipedia Aufbau.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top