Frage

Ich habe eine Reihe von Kategorien und möchte einen Dokumentenvektor mit Word -Vektor von Kategorien vergleichen, um die beste Matching -Kategorie zu finden.

Ist es möglich, einen Wortvektor mit einem Dokumentvektor zu vergleichen? Wenn ja, gibt es eine Literatur, die dafür ein Konzept für ein Konzept gibt?

War es hilfreich?

Lösung

Im Absatzvektor versucht der Vektor, die semantische Bedeutung aller Wörter im Kontext zu erfassen, indem der Vektor selbst in jeden Kontext gesetzt wird. Daher enthält der Absatzvektor schließlich die semantische Bedeutung aller Wörter im geschulten Kontext.

Wenn wir dies mit Word2VEC vergleichen, bewahrt jedes Wort in Word2VEC seine eigene semantische Bedeutung. Das Summieren aller Vektoren oder die Mittelung führt zu einem Vektor, der alle Semantik erhalten hat. Dies ist sinnvoll, da das Ergebnis, wenn wir die Vektoren (Transport+Wasser) hinzufügen, fast gleich Schiff oder Boot hinzufügen, was bedeutet, dass die Vektoren die Semantik zusammenfassen.

Bevor das Absatzvektorpapier veröffentlicht wurde, verwendeten die Personen gemittelte Wortvektoren als Satzvektoren. Um ehrlich zu sein, funktionieren diese durchschnittlichen Vektoren in meiner Arbeit besser als Dokumentvektoren. Mit diesen Dingen konnte sie auf diese Weise verglichen werden.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit datascience.stackexchange
scroll top