Domanda

Dopo aver eseguito un APC e studiare il procedimento mi chiedo che cosa il risultato è buono per la fase successiva. Dal PCA ho imparato come visualizzare il set di dati con la riduzione della dimensione, ho avuto a portata di mano nuovi vettori per descrivere i membri della popolazione in modo più efficiente e ho imparato che predittori originali correlano e contribuiscono più di altri.

mi pongo domande come, c'è più da imparare dalla PCA, è una buona idea quella di utilizzare il modello PCA per un algoritmi di apprendimento per eseguire meglio ed è possibile rispettare i predittori Nomial o ordinali nel PCA in qualche modo?

È stato utile?

Soluzione

Bene PCA, come suggerito in precedenza da @CarltonBanks, aiuta a rimuovere caratteristiche con il minor correlazione e l'uso schiacciare le caratteristiche insieme in modo tale che essi hanno la più alta correlazione.

Per rispondere alla tua domanda, come visualizzare dimensioni superiori utilizzando PCA

  1. Transform matrice delle caratteristiche con il numero di componenti del set di dati a 2 o 3
  2. In questo modo è possibile rappresentare il vostro set di dati in 2 o 3 dimensioni. Per vedere semplicemente la tua risposta proprio tracciare questa matrice trasformata in una trama 2D o 3D, rispettivamente.
  3. Questo aiuta a visualizzare un dato dimensionalità più elevate, di un soggetto 2D o 3D così mentre utilizzando la regressione o qualche tecnica di modellazione predittiva è possibile valutare l'andamento dei dati.

dovremmo usare PCA in macchina algoritmi di apprendimento più spesso?

Bene, che dipende strettamente, utilizzando PCA riduce la precisione dei dati impostato in modo meno che non avete bisogno di risparmiare un po 'di spazio dovuta a causa di un sacco di funzioni con cattive correlazione e l'accuratezza complessiva non importa. Se lo scenario macchina di modello di apprendimento è simile a questo, allora è ok per procedere.

Tuttavia, la maggior uso della PCA è come hai chiesto prima per la visualizzazione dei dati dimensionalità più elevati per determinare l'andamento dei dati e di verificare che si adatta modello migliore.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
scroll top