Pergunta

Eu estou correndo de Regressão Logit no Stata.

  1. Como posso saber que o poder explicativo da regressão (em OLS, eu olhar para R^2)?

  2. Existe uma abordagem significativa na expansão da regressão com outras variáveis independentes (em OLS, eu manualmente adicionando as variáveis independentes e procure ajustado R^2;meu palpite é Stata deve ter simplificado deste processo manual)?

Foi útil?

Solução

Eu estou preocupado que você está recebendo os fundamentos da modelagem de errado aqui:

  1. O poder explicativo de um modelo de regressão é, teoricamente, determinada por sua interpretação dos coeficientes, não pelo o R-quadrado.O R^2 representa a quantidade de variância que o modelo linear prevê, o que pode ser um ponto de referência adequado para o seu modelo, ou não.

  2. De forma idêntica, a presença ou ausência de uma variável independente no modelo requer substantivo a justificação.Se você deseja ter um olhar para a forma como o R-quadrado alterações ao adicionar ou subtrair partes do seu modelo, consulte help nestreg para ajudar na aninhadas regressão.

Para resumir:o poder explicativo do modelo e a sua composição variável não pode ser determinado apenas por desmembrar os números.Primeiro você precisa de uma adequada teoria para construir o seu modelo no.

Agora, se você estiver executando o logit:

  • Leia Long e Freese (Cap.3) entender como o log probabilidade converge (ou não) em seu modelo.
  • Não espere encontrar algo tão simples como o R-quadrado para logit.
  • Utilização logit diagnóstico em seu modelo, assim como você deve ser após a execução de OLS.

Você também pode querer ler o risco relativo (likelihood ratio Chi-quadrado, teste ou de execução adicionais lrtest comandos como explica Eric.

Outras dicas

O conceito do R^2 é sem sentido na regressão logit e você deve desconsiderar o McFadden Pseudo R2 no Stata de saída completamente.Lemeshow recomenda 'para avaliar a significância de uma variável independente é comparar o valor de D com e sem a variável independente na equação' com o teste de razão de Verossimilhança (G):G=D(Modelo sem variáveis [B])-D(Modelo com as variáveis [A]).

O teste de razão de Verossimilhança (G):

H0:coeficientes de eliminadas as variáveis são todos iguais a 0

Ha:pelo menos um coeficiente não é igual a 0

Quando o LR-teste p>.05 não rejeitar H0, o que significa que, estatisticamente falando, não há nenhuma vantagem para incluir o adicional de IV para o modelo.

Exemplo Stata sintaxe para fazer isso é:logit DV IV1 IV2 estimativas de armazenamento de Um logit DV IV1 estimativas loja B lrtest A B // i.e.testa se Um é 'aninhado' em B

Note, no entanto, que muitos mais aspectos verificados e testados antes de podermos concluir se é ou não um modelo logit é 'aceitável'.Para mais detauls, eu recomendo visitar:http://www.ats.ucla.edu/stat/stata/topics/logistic_regression.html

e consulte:

Aplicada a regressão logística, David W.Teste de Hosmer e Stanley Lemeshow , ISBN-13:978-0471356325

Eu concordo com o acima cartazes que quase qualquer medida de R^2 para um binário como modelo logit ou probit não deve ser considerado como muito importante.Existem maneiras para ver como bom de um trabalho seu modelo na previsão.Por exemplo, confira os seguintes comandos:

lroc 
estat class

Também, aqui está um bom artigo para ler mais:http://www.statisticalhorizons.com/r2logistic

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top