문제

Stata에서 Logit Regression을 실행하고 있습니다.

  1. 회귀 분석의 설명력을 어떻게 알 수 있나요(OLS에서는 R^2를 봅니다).

  2. 다른 독립 변수를 사용하여 회귀 분석을 확장하는 데 의미 있는 접근 방식이 있습니까?(OLS에서는 수동으로 독립 변수를 계속 추가하고 조정된 R^2를 찾습니다.내 생각엔 Stata가 이 수동 프로세스를 단순화했어야 했을 것 같아요)?

도움이 되었습니까?

해결책

여기서 모델링의 기본 사항을 얻는 것이 걱정됩니다 :

  1. 회귀 모델의 설명 전력은 R-squrared가 아닌 계수의 해석에 의해 이론적으로 결정됩니다. r ^ 2는 선형 모델이 예측하는 분산의 양을 나타내며, 이는 모델에 적절한 벤치 마크 일 수 있습니다.

  2. 동일하게, 모델의 독립 변수의 유무는 실질적인 정당화가 필요합니다. 모델의 을 추가하거나 뺄 때 R-Squared 변경 방법을 살펴보고 싶다면 help nestreg가 중첩 된 회귀에 대한 도움말을 참조하십시오. 요약 된

    : 모델의 설명 전력과 그 가변 조성은 숫자를 부르지 않도록 결정할 수 없습니다. 먼저 모델을 구축하는 적절한 이론이 필요합니다.

    이제 logit를 실행하는 경우 :

    • LONG 및 FREESE (CH. 3)를 읽으려면 모델에서 로그 가능성 수렴 (또는 그렇지 않음)을 이해합니다.
    • logit에 대한 R-squared로서 똑바로 무언가를 찾을 것으로 기대하지 않습니다.
    • Logit Diagnostics , 당신이 OLS를 실행 한 후에 있어야합니다.

      우도 비율을 읽거나 Eric에서 설명한대로 추가 lrtest 명령을 실행할 수도 있습니다.

다른 팁

R^2의 개념은 로짓 회귀 분석에서 의미가 없으며 Stata 출력에서 ​​McFadden Pseudo R2를 모두 무시해야 합니다.Lemeshow는 '독립변수의 유의성을 평가하기 위해 방정식에서 독립변수가 있는 경우와 없는 경우의 D 값을 우도비 테스트(G)와 비교'할 것을 권장합니다.G=D(변수 [B]가 없는 모델)-D(변수 [A]가 있는 모델).

우도비 검정(G):

H0:제거된 변수의 계수는 모두 0과 같습니다.

하아:적어도 하나의 계수가 0이 아닙니다.

LR-테스트 p>.05가 H0를 기각하지 않는 경우, 이는 통계적으로 말하면 추가 IV를 모델에 포함시키는 이점이 없음을 의미합니다.

이를 수행하는 Stata 구문의 예는 다음과 같습니다.Logit DV IV1 IV2 추정치 저장 A A Logit DV IV1 추정 상점 B Lrtest AB // IEA가 B에 '중첩'되어 있는지 테스트합니다.

그러나 로짓 모델이 '허용 가능한'지 여부를 결론짓기 전에 더 많은 측면을 확인하고 테스트해야 합니다.자세한 내용을 보려면 다음을 방문하는 것이 좋습니다.http://www.ats.ucla.edu/stat/stata/topics/logistic_regression.html

그리고 상담하세요:

응용 로지스틱 회귀, David W.호스머(Hosmer)와 스탠리 레메쇼(Stanley Lemeshow), ISBN-13:978-0471356325

나는 위의 포스터와 거의 모든 이진 모델에 대한 r ^ 2의 거의 모든 척도가 매우 중요하지 않아야합니다.예측시 당신의 모델이 어떻게되는지 확인하는 방법이 있습니다.예를 들어, 다음 명령을 확인하십시오.

lroc 
estat class
.

또한 여기에 더 읽기를위한 좋은 기사가 있습니다. http://www.statisticalhorizons.com/r2logistic

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top