문제
Stata에서 Logit Regression을 실행하고 있습니다.
회귀 분석의 설명력을 어떻게 알 수 있나요(OLS에서는 R^2를 봅니다).
다른 독립 변수를 사용하여 회귀 분석을 확장하는 데 의미 있는 접근 방식이 있습니까?(OLS에서는 수동으로 독립 변수를 계속 추가하고 조정된 R^2를 찾습니다.내 생각엔 Stata가 이 수동 프로세스를 단순화했어야 했을 것 같아요)?
해결책
여기서 모델링의 기본 사항을 얻는 것이 걱정됩니다 :
-
회귀 모델의 설명 전력은 R-squrared가 아닌 계수의 해석에 의해 이론적으로 결정됩니다. r ^ 2는 선형 모델이 예측하는 분산의 양을 나타내며, 이는 모델에 적절한 벤치 마크 일 수 있습니다.
-
동일하게, 모델의 독립 변수의 유무는 실질적인 정당화가 필요합니다. 모델의 을 추가하거나 뺄 때 R-Squared 변경 방법을 살펴보고 싶다면
help nestreg
가 중첩 된 회귀에 대한 도움말을 참조하십시오. 요약 된: 모델의 설명 전력과 그 가변 조성은 숫자를 부르지 않도록 결정할 수 없습니다. 먼저 모델을 구축하는 적절한 이론이 필요합니다.
이제
logit
를 실행하는 경우 :- LONG 및 FREESE (CH. 3)를 읽으려면 모델에서 로그 가능성 수렴 (또는 그렇지 않음)을 이해합니다.
- 는
logit
에 대한 R-squared로서 똑바로 무언가를 찾을 것으로 기대하지 않습니다. - Logit Diagnostics , 당신이 OLS를 실행 한 후에 있어야합니다.
우도 비율을 읽거나 Eric에서 설명한대로 추가
lrtest
명령을 실행할 수도 있습니다.
다른 팁
R^2의 개념은 로짓 회귀 분석에서 의미가 없으며 Stata 출력에서 McFadden Pseudo R2를 모두 무시해야 합니다.Lemeshow는 '독립변수의 유의성을 평가하기 위해 방정식에서 독립변수가 있는 경우와 없는 경우의 D 값을 우도비 테스트(G)와 비교'할 것을 권장합니다.G=D(변수 [B]가 없는 모델)-D(변수 [A]가 있는 모델).
우도비 검정(G):
H0:제거된 변수의 계수는 모두 0과 같습니다.
하아:적어도 하나의 계수가 0이 아닙니다.
LR-테스트 p>.05가 H0를 기각하지 않는 경우, 이는 통계적으로 말하면 추가 IV를 모델에 포함시키는 이점이 없음을 의미합니다.
이를 수행하는 Stata 구문의 예는 다음과 같습니다.Logit DV IV1 IV2 추정치 저장 A A Logit DV IV1 추정 상점 B Lrtest AB // IEA가 B에 '중첩'되어 있는지 테스트합니다.
그러나 로짓 모델이 '허용 가능한'지 여부를 결론짓기 전에 더 많은 측면을 확인하고 테스트해야 합니다.자세한 내용을 보려면 다음을 방문하는 것이 좋습니다.http://www.ats.ucla.edu/stat/stata/topics/logistic_regression.html
그리고 상담하세요:
응용 로지스틱 회귀, David W.호스머(Hosmer)와 스탠리 레메쇼(Stanley Lemeshow), ISBN-13:978-0471356325
나는 위의 포스터와 거의 모든 이진 모델에 대한 r ^ 2의 거의 모든 척도가 매우 중요하지 않아야합니다.예측시 당신의 모델이 어떻게되는지 확인하는 방법이 있습니다.예를 들어, 다음 명령을 확인하십시오.
lroc
estat class
.
또한 여기에 더 읽기를위한 좋은 기사가 있습니다. http://www.statisticalhorizons.com/r2logistic