Pregunta

Quiero utilizar análisis semántico latente para una pequeña aplicación que estoy construyendo, pero no quiero para construir las matrices de mí mismo. (En parte debido a que los documentos que tengo no haría una colección muy buena formación, porque son un poco corta y heterogéneo, y en parte porque acabo un equipo nuevo y se me hace una perra para instalar el álgebra lineal y tal bibliotecas que iba a necesitar.)

¿Hay algún "defecto" / implementaciones LSA pre-construidos disponibles? Por ejemplo, las cosas que estoy buscando son:

  • predeterminados U, S, matrices V (es decir, si D es una matriz término-documento de algún conjunto de entrenamiento, a continuación, D = USV ^ T es la descomposición de valor singular), de modo que dado cualquier consulta vector q, puedo usar estas matrices para calcular la proyección de la LSA q yo.
  • Algunos LSA algoritmo de recuadro negro que, dada una consulta vector q, devuelve la proyección LSA de q.
¿Fue útil?

Solución

probablemente estaría interesado en el href="http://nlp.fi.muni.cz/projekty/gensim/" rel="nofollow"> Gensim marco para Python; en particular, tiene un ejemplo en la construcción de las matrices apropiadas de Wikipedia Inglés .

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top