Attribuendo causalità variabile singola quasi indipendente
-
16-10-2019 - |
Domanda
Mi scuso se questo non è il posto giusto per chiedere -. Non sono sicuro se questo si adatta meglio con statistiche o Science Data ??p>
sto usando strumenti di analisi per aiutare i marketers identificare gli attributi dei loro utenti corrispondono a conversioni di successo (come qualcuno l'acquisto di un prodotto, l'iscrizione a una newsletter, o di abbonamento a un servizio). Gli attributi potrebbero essere le cose come quale sito Proveniente da (), la loro ubicazione, ora / giorno della settimana, tipo di dispositivo, il browser, ecc.
Quello che mi piacerebbe dire (anche se non sono certo che sia possibile) è quello di isolare in differenze tasso di conversione da un singolo attributo, qualcosa di simile, '11% degli utenti di Facebook convertito mentre solo il 3% di non -Facebook utenti convertiti', il che significa che l'attributo 'referrer' e il livello dell'attributo 'Facebook' sono responsabili per le conversioni.
Dato che io possa avere 100s di variabili quasi-indipendente, è anche possibile isolare l'effetto di una variabile e un livello di quella variabile? Al contrario di una loro combinazione che è più probabile che sia guidare la differenza? In caso affermativo, quale tecnica o paradigma concettuale fare uso per identificare quali di livello variabile è responsabile per il più grande ascensore in mia, tasso di conversione variabile dipendente?
Soluzione
vorrei suggerire di prendere in considerazione sia diretta riduzione dimensionalità approccio. Controllare mia risposta rilevante su questo sito. Un'altra opzione è quella di utilizzare valida variabile latente modellazione , per esempio, equazione modellazione strutturale . Si può iniziare con relativi articoli su Wikipedia ( questo e questo , corrispondentemente) e poi, se necessario, leggere più specializzati o articoli più pratici, carte e libri.