Как посчитать эту статистику?

https://stackoverflow.com/questions/1679

08-06-2019
|

Вопрос

Я пишу приложение, которое поможет облегчить некоторые исследования, и часть их включает в себя выполнение некоторых статистических расчетов.Прямо сейчас исследователи используют программу под названием СПСС.Часть вывода, которая их волнует, выглядит так:

[Part of the SPSS output

На самом деле их волнует только F и Sig. ценности.Моя проблема в том, что у меня нет опыта в статистике, и я не могу понять, как называются тесты и как их рассчитывать.

Я думал, F значение может быть результатом F-тест, но, выполнив шаги, указанные в Википедии, я получил результат, отличающийся от того, что SPSS дает.

Решение

Этот сайт может помочь вам немного больше.Также Вот этот.

Я работаю по довольно заржавевшим воспоминаниям о курсе статистики, но здесь ничего не выходит:

Когда вы выполняете дисперсионный анализ (ANOVA), вы фактически рассчитываете статистику F как соотношение среднеквадратических отклонений «между группами» и среднеквадратичных отклонений «внутри групп».Вторая ссылка выше кажется довольно хорошей для этого расчета.

Благодаря этому статистика F точно определяет, насколько сильна ваша модель, потому что дисперсия «между группами» является объяснительной силой, а дисперсия «внутри групп» — это случайная ошибка.Высокий F подразумевает очень значимую модель.

Как и во многих статистических операциях, вы определяете Sig обратно.используя статистику F.Здесь вам может пригодиться информация из Википедии.Что вы хотите сделать, так это, используя степени свободы, предоставленные вам SPSS, найти правильное значение P, при котором F стол даст вам статистику F, которую вы рассчитали.Значение P, при котором это происходит [F(таблица) = F(расчет)] является значимостью.

Концептуально, более низкое значение значимости показывает очень сильную способность отвергать нулевую гипотезу (что для этих целей означает определение объяснительной силы вашей модели).

Извините всех математиков, если что-то из этого не так.Я буду проверять, чтобы внести правки!!!

Удачи тебе.Статистика — это весело, но, возможно, не эта часть."="

Другие советы

Судя по вашему вопросу, я предполагаю, что ваши коллеги-исследователи хотят автоматизировать процесс выполнения определенного статистического анализа (т. е. они хотят пакетно обрабатывать наборы данных).У вас есть два варианта:

1) SPSS теперь доступен для сценариев через Python (начиная с версии 15) — перейдите на spss.com и найдите python.Вы можете писать скрипты Python для автоматизации анализа данных и извлечения значений ключей из сводных таблиц, а затем обрабатывать ответы любым удобным для вас способом.Это дает возможность точного сравнения результатов вашего скрипта Python и результатов, рассчитанных вручную в SPSS ваших коллег.Таким образом, вам не нужно знать никакой статистики для выполнения этой работы (что является ключевым преимуществом).

2) Вы можете сделать это в R, бесплатной среде статистики, которую, вероятно, можно написать в сценарии.Недостатком этого подхода является то, что вам придется изучить статистику, чтобы убедиться, что вы все делаете правильно.

Статистика – это сложно :-).После года чтения и перечитывания книг и статей могу только с уверенностью сказать, что понимаю самые основы этого.

Возможно, вам захочется изучить готовые библиотеки для любого языка программирования, который вы используете, потому что в них много ошибок в математике в целом и статистике в частности (очевидным примером являются ошибки округления).

В качестве примера вы можете взглянуть на проект Р, которая представляет собой одновременно интерактивную среду и библиотеку, которую вы можете использовать из своего кода C++, распространяемого под лицензией GPL (т. е. если вы используете ее только для внутренних целей и публикуете только результаты, вам не нужно открывать свой код).

Суммируя:не делайте этого вручную, свяжите/используйте существующее программное обеспечение.И ответ sain_grocen неверен.:(

Все это тесты на значимость оценок параметров, которые обычно используются в множественной регрессии с многомерным ответом.Это непростая задача вне среды статистического программирования.Я бы предложил либо получить результаты из уже существующей статистической программы, либо использовать ту, на которую вы можете ссылаться и использовать этот код.

Боюсь, что первый ответ (sain_grocen) уведет вас по неверному пути.Его объяснение, скорее всего, представляет собой особый случай того, с чем вы на самом деле имеете дело.Анова, описанная в его ссылках, предназначена для одновариантного ответа в сбалансированном дизайне.Это не та статистика F, которую вы видите.Имена в ваших выходных данных (След Пиллая, След Хотеллинга,...) представляют собой некоторые из доступных многовариантных версий.При определенных предположениях они имеют распределения F.Я не могу объяснить здесь материалы учебников, я бы посоветовал вам начать с рассмотрения «прикладного многомерного статистического анализа» Джонсона и Уишерна

Можете ли вы объяснить подробнее, почему SPSS сам по себе не является хорошим решением проблемы?Это то, что на выходе он генерирует сводные таблицы, которыми трудно манипулировать?Это стоимость программы?

F-статистика может возникнуть в результате любого количества конкретных тестов.F — это просто распределение (в общих чертах:описание «частот» групп значений), например Нормальный (Гауссов) или Равномерный.Как правило, они возникают из-за отношений дисперсий.Мнение:многие статистики (включая меня) считают F-тесты нестабильными (жаргон:не-крепкий).

Конкретная статистика вывода (трассировка Пиллаи и т. д.) предполагает, что исходный анализ представляет собой пример MANOVA, который, как описывают другие авторы, представляет собой сложную и трудную для понимания процедуру.

Я также предполагаю, что, основываясь на MANOVA и использовании SPSS, это психологический или социологический проект...если нет, пожалуйста, просветите.Возможно, другие, более простые модели на самом деле будут легче понять и воспроизвести.Проконсультируйтесь со статистической консультационной группой вашего местного университета, если она у вас есть.

Удачи!

Вот объяснение результатов MANOVA с очень хорошего сайта по статистике и SPSS:

Вывод с объяснением:http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Как и зачем делать MANOVA или многомерный GLM:(тот же путь, что и выше, но заканчивается на «/manova.htm»)

Написание программного обеспечения с нуля для расчета этих результатов было бы долгим и трудным;предстоит решить множество числовых задач и обращений матриц.

Как сказал Генри, используйте скрипты Python или R.Я бы посоветовал работать с кем-нибудь, кто знает SPSS при написании сценариев.Кроме того, сам SPSS способен экспортировать выходные таблицы в файлы с помощью так называемой OMS.Это можно сделать с помощью сценария в составе SPSS.

Узнайте, кто в вашей исследовательской группе знает SPSS, и работайте с ними.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow