Domanda

voglio usare Latent Semantic Analysis per una piccola applicazione che sto costruendo, ma non voglio per costruire le matrici me stesso. (In parte perché i documenti che ho non avrebbe una collezione molto buona formazione, perché sono un pò corta ed eterogeneo, e in parte perché ho appena ricevuto un nuovo computer e sto trovando una cagna per installare l'algebra lineare e tale biblioteche avrei bisogno.)

Ci sono dei "default" / pre-costruito implementazioni LSA disponibili? Ad esempio, le cose che sto cercando sono:

  • predefinite U, S, matrici V (vale a dire, se D è una matrice termine-documento da qualche training set, quindi D = USV ^ T è il valore singolare decomposizione), in modo che in tutta la domanda vettore q, posso usare queste matrici per calcolare la proiezione di LSA q me.
  • Alcuni algoritmo LSA black-box che, data una query vettore q, torna la proiezione LSA di q.
È stato utile?

Soluzione

si sarebbe probabilmente essere interessato al Gensim quadro per Python; in particolare, esso ha una lista sulla costruzione di matrici appropriate da Inglese Wikipedia .

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top