Frage

Ich führe die Logit-Regression in Stata aus.

  1. Wie kann ich die Erklärungskraft der Regression ermitteln (in OLS schaue ich mir R^2 an)?

  2. Gibt es einen sinnvollen Ansatz, die Regression mit anderen unabhängigen Variablen zu erweitern (in OLS füge ich die unabhängigen Variablen manuell hinzu und suche nach angepasstem R^2;Ich vermute, dass Stata diesen manuellen Prozess hätte vereinfachen sollen.)

War es hilfreich?

Lösung

Ich mache mir Sorgen, dass Sie hier die Grundlagen der Modellierung falsch verstehen:

  1. Die Aussagekraft eines Regressionsmodells wird theoretisch durch Ihre Interpretation der Koeffizienten bestimmt, nicht durch das R-Quadrat.Das R^2 stellt den Varianzbetrag dar, den Ihr lineares Modell vorhersagt, was möglicherweise ein geeigneter Benchmark für Ihr Modell ist oder nicht.

  2. Ebenso erfordert das Vorhandensein oder Fehlen einer unabhängigen Variablen in Ihrem Modell eine inhaltliche Begründung.Wenn Sie sehen möchten, wie sich das R-Quadrat beim Addieren oder Subtrahieren ändert Teile Ihres Modells, siehe help nestreg für Hilfe zur verschachtelten Regression.

Zusammenfassen:Die Erklärungskraft Ihres Modells und seiner variablen Zusammensetzung lässt sich nicht allein durch die Berechnung der Zahlen ermitteln.Sie benötigen zunächst eine adäquate Theorie, auf der Sie Ihr Modell aufbauen können.

Nun, wenn Sie laufen logit:

  • Lesen Sie Long und Freese (Kap.3) um zu verstehen, wie die Log-Likelihood in Ihrem Modell konvergiert (oder nicht).
  • Erwarten Sie nicht, etwas so Einfaches wie das R-Quadrat zu finden logit.
  • Verwenden Logit-Diagnose auf Ihrem Modell, so wie Sie es nach dem Ausführen von OLS sein sollten.

Möglicherweise möchten Sie auch den Chi-Quadrat-Test für das Wahrscheinlichkeitsverhältnis lesen oder einen weiteren Test durchführen lrtest Befehle wie von Eric erklärt.

Andere Tipps

Das Konzept von R ^ 2 ist in der Logit-Regression sinnlos, und Sie sollten den McFaddden Pseudo R2 in der Stata-Ausgabe insgesamt ignorieren. LEMESHOW empfiehlt, die Bedeutung einer unabhängigen Variablen einzuschätzen, die wir den Wert von D mit und ohne die unabhängige Variable in der Gleichung mit dem Wahrscheinlichkeitsverhältnis-Test (G) vergleichen: G= D (Modell ohne Variablen [B]) - D ( Modell mit Variablen [a]).

Der Wahrscheinlichkeitsverhältnis Test (G):

h0: Koeffizienten für eliminierte Variablen sind alle gleich 0

ha: Mindestens ein Koeffizient ist nicht gleich 0

Wenn der LR-Test p> .05 H0 nicht ablehnen, der das impliziert, was statistisch gesprochen hat, gibt es keinen Vorteil, um die zusätzlichen IVs in das Modell aufzunehmen.

Beispiel Stata-Syntax, um dies zu tun, ist: Logit DV IV1 IV2 Schätzt den Laden A. Logit DV IV1. Schätzungen Shop B. lrtest a b // de.e. Tests, wenn a 'verschachtelte' in b ist

Hinweis, dass jedoch viele weitere Aspekte überprüft und getestet werden müssen, bevor wir abschließen können, ob ein Logit-Modell "akzeptabel" ist oder nicht. Für mehr Detaul empfehle ich es zu besuchen: http://www.ats.ucla.edu/stat/stata/topics /logistic_reGresssion.html

und konsultieren:

Angewandte logistische Regression, David W. Hosmer und Stanley Lemeshow, ISBN-13: 978-0471356325

Ich stimme sicherlich mit den oben genannten Plakaten ein, dass fast jedes Maß von R ^ 2 für ein binäres Modell wie Logit oder Probit nicht als sehr wichtig angesehen werden sollte.Es gibt Möglichkeiten, zu sehen, wie gut ein Job Ihr Modell vorhersagt.Aktivieren Sie zum Beispiel die folgenden Befehle: generasacodicetagpre.

Auch hier ist ein guter Artikel zum weiteren Lesen: http://www.statisticalhorizons.com/r2logistic

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top