Эквивалент R ^ 2 для регрессии в логите в СТАС

StackOverflow https://stackoverflow.com//questions/12657983

  •  11-12-2019
  •  | 
  •  

Вопрос

Я бегаю регрессию логита в Stata.

  1. Как я могу узнать пояснительную силу регрессии (в OLS, я смотрю на r ^ 2)?

  2. Есть ли значимый подход в расширении регрессии с другими независимыми переменными (в OLS, я вручную продолжаю добавить независимые переменные и искать скорректированные R ^ 2; я предполагаю, что я думаю, что упростить этот ручной процесс)?

Это было полезно?

Решение

Я волнуюсь, что вы получаете основы моделирования здесь:

  1. Пояснительная мощность модели регрессии теоретически определяется вашим интерпретацией коэффициентов, а не R-квадрата. R ^ 2 представляет собой величину дисперсии, которое предсказывает вашу линейную модель, которая может быть соответствующим ориентиром для вашей модели или нет.

  2. тождественно, наличие или отсутствие независимой переменной в вашей модели требует существенного оправдания. Если вы хотите посмотреть на то, как r-квадрат изменяется при добавлении или вычитании деталей вашей модели, см. Генеракодицетагкод для помощи в вложенной регрессии.

    Для суммирования: пояснительная мощность вашей модели и ее переменной композиции не может быть определена только путем хрустания чисел. Сначала вам нужна адекватная теория для создания вашей модели на.

    Теперь, если вы используете help nestreg:

      .
    • читайте длинные и фрейзе (гл. 3), чтобы понять, как журнал вероятность сходится (или нет) в вашей модели.
    • Не ожидайте найти что-то простое, как R-квадрат для logit.
    • Использование Логит Диагностика на вашу модель Как вы должны быть после запуска OLS.

      Вы также можете прочитать тестирование коэффициента правдоподогония Chi-Squared или запустить дополнительные команды logit, как объяснено Eric.

Другие советы

Концепция R ^ 2 бессмыслена в регрессии в логире, и вы должны пренебрегать McFadden Pseudo R2 в результате вывода Stata. Lemeshow рекомендует оценить значение независимой переменной, которую мы сравниваем значение d с независимой переменной в уравнении »с тестом соотношения вероятности (G): G= D (модель без переменных [b]) - D ( Модель с переменными [A]).

Тест соотношения правдоподобия (G):

H0: коэффициенты для устраненных переменных равны 0

ha: хотя бы один коэффициент не равен 0

Когда LR-тест P> .05 не отказывается от H0, что подразумевает, что статистически говоря, нет никакого преимущества, чтобы включить дополнительные IV в модель.

Пример синтаксиса Stata для этого есть: logit dv iv1 iv2 Оценка хранения А. logit dv iv1. Оценка хранения B. LRTEST A B // I.E. Испытания, если A «вложено» в B

Обратите внимание, однако, что многие другие аспекты должны проверить и протестировать, прежде чем мы можем сделать вывод, является ли модель логита «приемлемой». Для большего количества детенов я рекомендую посетить: http://www.ats.ucla.edu/stat/stata/topics /logistic_regression.html

и проконсультируйтесь:

Прикладная логистическая регрессия, Дэвид У. Хосмер и Стэнли Лемшоу, ISBN-13: 978-0471356325

Я, конечно, согласен с вышеуказанными плакатами, что почти любая мера R ^ 2 для двоичной модели, такой как логит или потергун, не должна считаться очень важным.Есть способы увидеть, насколько хороша работа ваша модель делает при прогнозировании.Например, проверьте следующие команды:

lroc 
estat class
.

Также, вот хорошая статья для дальнейшего чтения: http://www.statisticalhorizons.com/r2logistic

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top