Equivalente r ^ 2 per la regressione logica in Stata

https://stackoverflow.com//questions/12657983

stata

11-12-2019
|

Domanda

Sto eseguendo la regressione logit in Stata.

Come posso sapere il potere esplicativo della regressione (in OLS, guardo r ^ 2)?
C'è un approccio significativo nell'espansione della regressione con altre variabili indipendenti (in OLS, continuo a aggiungere le variabili indipendenti e cerca la modifica R ^ 2; la mia ipotesi è Stata avrebbe dovuto semplificare questo processo manuale)?

Soluzione

Sono preoccupato di ottenere i fondamenti della modellazione sbagliata qui:

La potenza esplicativa di un modello di regressione è teoricamente determinata dalla vostra interpretazione dei coefficienti, non dal quadrato R. Il R ^ 2 rappresenta la quantità di varianza che prevede il modello lineare, che potrebbe essere un benchmark appropriato al modello o meno.
Idimentalamente, la presenza o l'assenza di una variabile indipendente nel tuo modello richiede giustificazione sostanziale. Se si desidera dare un'occhiata a come il quadrato R-Squared durante l'aggiunta o la sottrazione parti del tuo modello, vedere help nestreg per aiuto sulla regressione annidata.
Per riassumere: il potere esplicativo del tuo modello e la sua composizione variabile non può essere determinata semplicemente scricchiolante i numeri. Per prima cosa hai bisogno di una teoria adeguata per costruire il tuo modello.
Ora, se stai eseguendo logit:

Altri suggerimenti

Il concetto di r ^ 2 è privo di significato nella regressione di logit e si dovrebbe ignorare il McFadden Pseudo R2 nell'output di Stata del tutto. Leseshow raccomanda 'Valutare il significato di una variabile indipendente Confrontiamo il valore di D con e senza la variabile indipendente nell'equazione "con il test del rapporto di probabilità (G): G= D (modello senza variabili [B]) - D ( Modello con variabili [A]).

Il test del rapporto di probabilità (G):

H0: I coefficienti per le variabili eliminati sono tutti uguali a 0

ha: almeno un coefficiente non è uguale a 0

Quando il test LR P> .05 non rifiutare H0, il che implica che, statisticamente parlando, non c'è vantaggio includere l'IV aggiuntivo nel modello.

Esempio Sintassi STATA per fare ciò è: Logit DV IV1 IV2 Stime Store A. Logit DV IV1. Stime Store B. LRTEST A B // I.e. Test se A è "annidato" in B

Nota, tuttavia, che molti altri aspetti devono essere controllati e testati prima che possiamo concludere se un modello logit sia "accettabile". Per maggiori detali, consiglio di visitare: http://www.ats.ucla.edu/stat/stata/topics /logo_regressiression.html

e consultare:

Regressione logistica applicata, David W. Hosmer e Stanley Lemeshow, ISBN-13: 978-0471356325

Sono certamente d'accordo con i poster sopra riportati che quasi qualsiasi misura di R ^ 2 per un modello binario come logit o probit non dovrebbe essere considerato molto importante.Ci sono modi per vedere quanto è buono di un lavoro il tuo modello fa prevedere.Ad esempio, controlla i seguenti comandi:

lroc 
estat class

Inoltre, ecco un buon articolo per ulteriori letture: http://www.statisticalhorizons.com/r2logistic

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow