Эквивалент R ^ 2 для регрессии в логите в СТАС
-
11-12-2019 - |
Вопрос
Я бегаю регрессию логита в Stata.
-
Как я могу узнать пояснительную силу регрессии (в OLS, я смотрю на r ^ 2)?
-
Есть ли значимый подход в расширении регрессии с другими независимыми переменными (в OLS, я вручную продолжаю добавить независимые переменные и искать скорректированные R ^ 2; я предполагаю, что я думаю, что упростить этот ручной процесс)?
Решение
Я волнуюсь, что вы получаете основы моделирования здесь:
-
Пояснительная мощность модели регрессии теоретически определяется вашим интерпретацией коэффициентов, а не R-квадрата. R ^ 2 представляет собой величину дисперсии, которое предсказывает вашу линейную модель, которая может быть соответствующим ориентиром для вашей модели или нет.
-
тождественно, наличие или отсутствие независимой переменной в вашей модели требует существенного оправдания. Если вы хотите посмотреть на то, как r-квадрат изменяется при добавлении или вычитании деталей вашей модели, см. Генеракодицетагкод для помощи в вложенной регрессии.
Для суммирования: пояснительная мощность вашей модели и ее переменной композиции не может быть определена только путем хрустания чисел. Сначала вам нужна адекватная теория для создания вашей модели на.
Теперь, если вы используете
help nestreg
:- .
- читайте длинные и фрейзе (гл. 3), чтобы понять, как журнал вероятность сходится (или нет) в вашей модели.
- Не ожидайте найти что-то простое, как R-квадрат для
logit
. - Использование Логит Диагностика на вашу модель Как вы должны быть после запуска OLS.
Вы также можете прочитать тестирование коэффициента правдоподогония Chi-Squared или запустить дополнительные команды
logit
, как объяснено Eric.
Другие советы
Концепция R ^ 2 бессмыслена в регрессии в логире, и вы должны пренебрегать McFadden Pseudo R2 в результате вывода Stata. Lemeshow рекомендует оценить значение независимой переменной, которую мы сравниваем значение d с независимой переменной в уравнении »с тестом соотношения вероятности (G): G= D (модель без переменных [b]) - D ( Модель с переменными [A]).
Тест соотношения правдоподобия (G):
H0: коэффициенты для устраненных переменных равны 0
ha: хотя бы один коэффициент не равен 0
Когда LR-тест P> .05 не отказывается от H0, что подразумевает, что статистически говоря, нет никакого преимущества, чтобы включить дополнительные IV в модель.
Пример синтаксиса Stata для этого есть: logit dv iv1 iv2 Оценка хранения А. logit dv iv1. Оценка хранения B. LRTEST A B // I.E. Испытания, если A «вложено» в B
Обратите внимание, однако, что многие другие аспекты должны проверить и протестировать, прежде чем мы можем сделать вывод, является ли модель логита «приемлемой». Для большего количества детенов я рекомендую посетить: http://www.ats.ucla.edu/stat/stata/topics /logistic_regression.html
и проконсультируйтесь:
Прикладная логистическая регрессия, Дэвид У. Хосмер и Стэнли Лемшоу, ISBN-13: 978-0471356325
Я, конечно, согласен с вышеуказанными плакатами, что почти любая мера R ^ 2 для двоичной модели, такой как логит или потергун, не должна считаться очень важным.Есть способы увидеть, насколько хороша работа ваша модель делает при прогнозировании.Например, проверьте следующие команды:
lroc
estat class
.
Также, вот хорошая статья для дальнейшего чтения: http://www.statisticalhorizons.com/r2logistic