Equivalente r ^ 2 per la regressione logica in Stata
-
11-12-2019 - |
Domanda
Sto eseguendo la regressione logit in Stata.
- .
-
Come posso sapere il potere esplicativo della regressione (in OLS, guardo r ^ 2)?
-
C'è un approccio significativo nell'espansione della regressione con altre variabili indipendenti (in OLS, continuo a aggiungere le variabili indipendenti e cerca la modifica R ^ 2; la mia ipotesi è Stata avrebbe dovuto semplificare questo processo manuale)?
Soluzione
Sono preoccupato di ottenere i fondamenti della modellazione sbagliata qui:
- .
-
La potenza esplicativa di un modello di regressione è teoricamente determinata dalla vostra interpretazione dei coefficienti, non dal quadrato R. Il R ^ 2 rappresenta la quantità di varianza che prevede il modello lineare, che potrebbe essere un benchmark appropriato al modello o meno.
-
Idimentalamente, la presenza o l'assenza di una variabile indipendente nel tuo modello richiede giustificazione sostanziale. Se si desidera dare un'occhiata a come il quadrato R-Squared durante l'aggiunta o la sottrazione parti del tuo modello, vedere
help nestreg
per aiuto sulla regressione annidata.Per riassumere: il potere esplicativo del tuo modello e la sua composizione variabile non può essere determinata semplicemente scricchiolante i numeri. Per prima cosa hai bisogno di una teoria adeguata per costruire il tuo modello.
Ora, se stai eseguendo
logit
:- .
- Leggi lunghi e freese (capire 3) per capire come converge (o meno) il registro (o no) nel tuo modello.
- Non aspettarsi di trovare qualcosa come semplice come il quadrato R per
logit
. - Utilizzare logit diagnostica sul tuo modello , proprio come dovresti essere dopo aver eseguito OLS.
Si potrebbe anche desiderare di leggere il test del ratio di probabilità o eseguire ulteriori comandi
lrtest
come spiegato da Eric.
Altri suggerimenti
Il concetto di r ^ 2 è privo di significato nella regressione di logit e si dovrebbe ignorare il McFadden Pseudo R2 nell'output di Stata del tutto. Leseshow raccomanda 'Valutare il significato di una variabile indipendente Confrontiamo il valore di D con e senza la variabile indipendente nell'equazione "con il test del rapporto di probabilità (G): G= D (modello senza variabili [B]) - D ( Modello con variabili [A]).
Il test del rapporto di probabilità (G):
H0: I coefficienti per le variabili eliminati sono tutti uguali a 0
ha: almeno un coefficiente non è uguale a 0
Quando il test LR P> .05 non rifiutare H0, il che implica che, statisticamente parlando, non c'è vantaggio includere l'IV aggiuntivo nel modello.
Esempio Sintassi STATA per fare ciò è: Logit DV IV1 IV2 Stime Store A. Logit DV IV1. Stime Store B. LRTEST A B // I.e. Test se A è "annidato" in B
Nota, tuttavia, che molti altri aspetti devono essere controllati e testati prima che possiamo concludere se un modello logit sia "accettabile". Per maggiori detali, consiglio di visitare: http://www.ats.ucla.edu/stat/stata/topics /logo_regressiression.html
e consultare:
Regressione logistica applicata, David W. Hosmer e Stanley Lemeshow, ISBN-13: 978-0471356325
Sono certamente d'accordo con i poster sopra riportati che quasi qualsiasi misura di R ^ 2 per un modello binario come logit o probit non dovrebbe essere considerato molto importante.Ci sono modi per vedere quanto è buono di un lavoro il tuo modello fa prevedere.Ad esempio, controlla i seguenti comandi:
lroc
estat class
.
Inoltre, ecco un buon articolo per ulteriori letture: http://www.statisticalhorizons.com/r2logistic