Domanda

Sto cercando di avvolgere la testa intorno a vae e ho difficoltà a capire cosa viene visualizzato quando le persone fanno trame di dispersione del spazio latente. Penso di capire il concetto di collo di bottiglia; andiamo da $ N $ Dimensioni di input a $ H $ dimensioni nascoste a a $ Z $ Gaussiano dimensionale con $ Z $ valori medi, e $ Z $ valori di varianza. Per esempio qui (che si basa sul Pytorch ufficiale Esempio VAE), $ N = 784, h = 400 $ e $ Z = 20 $.

Quando le persone realizzano trame di dispersione 2D, cosa tracciano effettivamente? Nell'esempio sopra lo strato di collo di bottiglia è 20 dimensionale, il che significa che ci sono 40 caratteristiche (contano entrambe $ mu $ e $ Sigma $). Le persone fanno PCA o TSNE o qualcosa del genere? Anche se $ Z = 2 $ Ci sono ancora quattro caratteristiche, quindi non capisco come viene realizzato il diagramma a dispersione che mostra il clustering, diciamo in mnist.

Nessuna soluzione corretta

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top