質問

私が構築している小さなアプリには潜在セマンティック分析を使用したいのですが、自分でマトリックスを構築したくありません。 (部分的には、私が持っているドキュメントが非常に良いトレーニングコレクションを作成しないためです。なぜなら、それらはちょっと短くて不均一であり、一部は新しいコンピューターを手に入れただけで、線形代数などをインストールするための雌犬だと思っているからです。私が必要とするライブラリ。)

利用可能な「デフォルト」/事前に構築されたLSA実装はありますか?たとえば、私が探しているものは次のとおりです。

  • デフォルトu、s、v行列(すなわち、dがいくつかのトレーニングセットの用語ドキュメントマトリックスの場合、d = usv^tは特異値分解です)。 QのLSA投影を自分で計算します。
  • クエリベクトルqを与えられた場合、qのLSA投影を返すブラックボックスLSAアルゴリズム。
役に立ちましたか?

解決

あなたはおそらくに興味があるでしょう 生成 Pythonのフレームワーク。特に、持っています 英語のウィキペディアからの適切なマトリックスの構築に関する例.

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top