Question

J'utilise Logit Regression dans Stata.

  1. Comment connaître le pouvoir explicatif de la régression (en OLS, je regarde R^2) ?

  2. Existe-t-il une approche significative pour étendre la régression avec d'autres variables indépendantes (dans OLS, je continue d'ajouter manuellement les variables indépendantes et de rechercher R ^ 2 ajusté ;je suppose que Stata aurait dû simplifier ce processus manuel) ?

Était-ce utile?

La solution

Je crains que vous vous trompiez ici sur les principes fondamentaux de la modélisation :

  1. Le pouvoir explicatif d'un modèle de régression est théoriquement déterminé par votre interprétation des coefficients, et non par le R au carré.Le R^2 représente la quantité de variance prédite par votre modèle linéaire, qui peut ou non constituer une référence appropriée pour votre modèle.

  2. De la même manière, la présence ou l’absence d’une variable indépendante dans votre modèle nécessite une justification substantielle.Si vous souhaitez voir comment le R au carré change lors de l'ajout ou de la soustraction les pièces de votre modèle, voir help nestreg pour obtenir de l'aide sur la régression imbriquée.

Résumer:le pouvoir explicatif de votre modèle et sa composition variable ne peuvent pas être déterminés simplement en analysant les chiffres.Vous avez d’abord besoin d’une théorie adéquate sur laquelle construire votre modèle.

Maintenant, si vous courez logit:

  • Lisez Long et Freese (Ch.3) pour comprendre comment le log de vraisemblance converge (ou non) dans votre modèle.
  • Ne vous attendez pas à trouver quelque chose d'aussi simple que le R au carré pour logit.
  • Utiliser diagnostics logit sur votre modèle, tout comme vous devriez l'être après avoir exécuté OLS.

Vous souhaiterez peut-être également lire le test du chi carré du rapport de vraisemblance ou exécuter des tests supplémentaires. lrtest commandes comme expliqué par Eric.

Autres conseils

Le concept de R ^ 2 n'a pas de sens dans la régression logit et vous devez ignorer le Pseudo R2 de McFadden dans la sortie Stata. Lemeshow recommande «d'évaluer l'importance d'une variable indépendante, nous comparons la valeur de D avec et sans la variable indépendante de l'équation» avec le test de rapport de vraisemblance (G): G= D (modèle sans variables [B]) - D ( Modèle avec variables [a]).

Test de rapport de vraisemblance (G):

H0: les coefficients pour les variables éliminées sont tous égaux à 0

ha: au moins un coefficient n'est pas égal à 0

Lorsque le test LR-Test P> .05 ne rejette pas H0, ce qui implique que, statistiquement, il n'y a aucun avantage d'inclure les IV supplémentaires dans le modèle.

Exemple Syntaxe Stata Pour ce faire est: LOGIT DV IV1 IV2 estime stocker un logit dv iv1 Estimation du magasin B LRTEST A B // I.E. TESTS Si A est "imbriqué" dans B

Notez cependant que beaucoup d'autres aspects doivent être vérifiés et testés avant de pouvoir conclure si un modèle logit est «acceptable». Pour plus de Dethers, je recommande de visiter: http://www.ats.uclé.edu/stat/stata/topie /logistic_regrression.html

et consultez:

Régression logistique appliquée, David W. Hosmer et Stanley Lemeshow, ISBN-13: 978-0471356325

Je suis certainement d'accord avec les affiches ci-dessus que presque toute mesure de R ^ 2 pour un modèle binaire comme la logit ou la probité ne devrait pas être considérée comme très importante.Il existe des moyens de voir à quel point votre modèle est bon de votre modèle à prédire.Par exemple, consultez les commandes suivantes:

lroc 
estat class

Aussi, voici un bon article pour la lecture supplémentaire: http://www.statisticticalhorizons.com/r2logistic

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top