Cosa visualizziamo nel mostrare uno spazio latente VAE?
-
01-11-2019 - |
Domanda
Sto cercando di avvolgere la testa intorno a vae e ho difficoltà a capire cosa viene visualizzato quando le persone fanno trame di dispersione del spazio latente. Penso di capire il concetto di collo di bottiglia; andiamo da $ N $ Dimensioni di input a $ H $ dimensioni nascoste a a $ Z $ Gaussiano dimensionale con $ Z $ valori medi, e $ Z $ valori di varianza. Per esempio qui (che si basa sul Pytorch ufficiale Esempio VAE), $ N = 784, h = 400 $ e $ Z = 20 $.
Quando le persone realizzano trame di dispersione 2D, cosa tracciano effettivamente? Nell'esempio sopra lo strato di collo di bottiglia è 20 dimensionale, il che significa che ci sono 40 caratteristiche (contano entrambe $ mu $ e $ Sigma $). Le persone fanno PCA o TSNE o qualcosa del genere? Anche se $ Z = 2 $ Ci sono ancora quattro caratteristiche, quindi non capisco come viene realizzato il diagramma a dispersione che mostra il clustering, diciamo in mnist.
Nessuna soluzione corretta