Frage

Ich schreibe eine App, um einige Recherchen zu erleichtern, und ein Teil davon umfasst die Durchführung einiger statistischer Berechnungen.Derzeit verwenden die Forscher ein Programm namens SPSS.Ein Teil der Ausgabe, die ihnen wichtig ist, sieht so aus:

[Part of the SPSS output

Eigentlich geht es ihnen nur darum F Und Sig. Werte.Mein Problem ist, dass ich keine Kenntnisse in Statistik habe und nicht herausfinden kann, wie die Tests heißen oder wie man sie berechnet.

Ich dachte das F Der Wert könnte das Ergebnis des sein F-Test, aber nachdem ich die auf Wikipedia angegebenen Schritte befolgt hatte, erhielt ich ein Ergebnis, das sich von dem unterschied, was SPSS gibt.

War es hilfreich?

Lösung

Diese Internetseite könnte dir vielleicht etwas weiterhelfen.Auch Dieses hier.

Ich arbeite mit einer ziemlich eingerosteten Erinnerung an einen Statistikkurs, aber hier geht nichts weiter:

Wenn Sie eine Varianzanalyse (ANOVA) durchführen, berechnen Sie die F-Statistik tatsächlich als Verhältnis aus den mittleren quadratischen Varianzen „zwischen den Gruppen“ und den mittleren quadratischen Varianzen „innerhalb der Gruppen“.Der zweite Link oben scheint für diese Berechnung ziemlich gut zu sein.

Dadurch misst die F-Statistik genau, wie aussagekräftig Ihr Modell ist, da die Varianz „zwischen den Gruppen“ die Erklärungskraft und die Varianz „innerhalb der Gruppen“ ein Zufallsfehler ist.Hohes F impliziert ein hochsignifikantes Modell.

Wie bei vielen statistischen Operationen bestimmen Sie Sig zurück.unter Verwendung der F-Statistik.Hier sind Ihre Wikipedia-Informationen etwas praktisch.Was Sie tun möchten, ist – mithilfe der Freiheitsgrade, die Ihnen SPSS bietet – den richtigen P-Wert zu finden, bei dem an F-Tisch gibt Ihnen die F-Statistik, die Sie berechnet haben.Der P-Wert, bei dem dies geschieht [F(Tabelle) = F(berechnet)], ist die Signifikanz.

Konzeptionell zeigt ein niedrigerer Signifikanzwert eine sehr starke Fähigkeit an, die Nullhypothese abzulehnen (was für diese Zwecke bedeutet, dass Ihr Modell über Erklärungskraft verfügt).

Tut mir leid an alle Mathe-Leute, wenn irgendetwas davon falsch ist.Ich werde noch einmal vorbeischauen, um Änderungen vorzunehmen!!!

Viel Glück.Statistiken machen Spaß, nur vielleicht nicht dieser Teil.=)

Andere Tipps

Aufgrund Ihrer Frage gehe ich davon aus, dass Ihre Forschungskollegen den Prozess automatisieren möchten, mit dem bestimmte statistische Analysen durchgeführt werden (d. h. sie möchten Datensätze stapelweise verarbeiten).Sie haben zwei Möglichkeiten:

1) SPSS ist jetzt über Python skriptfähig (ab Version 15) – gehen Sie zu spss.com und suchen Sie nach „Python“.Sie können Python-Skripte schreiben, um Datenanalysen zu automatisieren und Schlüsselwerte aus Pivot-Tabellen zu extrahieren, und die Antworten dann nach Ihren Wünschen verarbeiten.Dies hat den Vorteil, dass ein genauer Vergleich zwischen den Ergebnissen Ihres Python-Skripts und den manuell berechneten Anstrengungen Ihrer Mitarbeiter in SPSS möglich ist.Daher müssen Sie für diese Arbeit keine wirklichen Statistiken kennen (was ein entscheidender Vorteil ist).

2) Sie könnten dies in R tun, einer kostenlosen Statistikumgebung, die wahrscheinlich per Skript erstellt werden könnte.Dies hat den Nachteil, dass Sie Statistiken erlernen müssen, um sicherzustellen, dass Sie es richtig machen.

Statistiken sind schwer :-).Nachdem ich ein Jahr lang immer wieder Bücher und Aufsätze gelesen habe, kann ich nur mit Zuversicht sagen, dass ich die Grundlagen davon verstehe.

Möglicherweise möchten Sie vorgefertigte Bibliotheken für die von Ihnen verwendete Programmiersprache untersuchen, da sie in der Mathematik im Allgemeinen und in der Statistik im Besonderen viele Fallstricke darstellen (Rundungsfehler sind ein offensichtliches Beispiel).

Als Beispiel könnten Sie einen Blick darauf werfen das R-Projekt, bei der es sich sowohl um eine interaktive Umgebung als auch um eine Bibliothek handelt, die Sie aus Ihrem C++-Code heraus verwenden können, der unter der GPL vertrieben wird (d. h. wenn Sie ihn nur intern verwenden und nur die Ergebnisse veröffentlichen, müssen Sie Ihren Code nicht öffnen).

Zusamenfassend:Tun Sie dies nicht manuell, sondern verknüpfen/verwenden Sie vorhandene Software.Und die Antwort von sain_grocen ist falsch.:(

Dies sind alles Tests zur Signifikanz von Parameterschätzungen, die typischerweise in multivariaten multiplen Regressionen verwendet werden.Außerhalb einer statistischen Programmierumgebung wären dies keine einfachen Dinge.Ich würde vorschlagen, entweder die Ausgabe von einem bereits vorhandenen Statistikprogramm abzurufen oder eines zu verwenden, mit dem Sie einen Link erstellen und diesen Code verwenden können.

Ich fürchte, dass die erste Antwort (die von sain_grocen) Sie auf den falschen Weg führen wird.Seine Erklärung bezieht sich wahrscheinlich auf einen Sonderfall dessen, womit Sie es tatsächlich zu tun haben.Die in seinen Links erläuterte Anova gilt für eine einzelne unterschiedliche Antwort in einem ausgewogenen Design.Dies sind nicht die F-Statistiken, die Sie sehen.Die Namen in Ihrer Ausgabe (Pillai's Trace, Hotelling's Trace,...) sind einige der verfügbaren multivariaten Versionen.Unter bestimmten Annahmen haben sie F-Verteilungen.Ich kann hier keine Lehrbücher im Wert von Material erklären. Ich würde Ihnen raten, zunächst "angewandte multivariate statistische Analyse" von Johnson und Wichern zu betrachten

Können Sie näher erläutern, warum SPSS selbst keine gute Lösung für das Problem ist?Liegt es daran, dass als Ausgabe Pivot-Tabellen generiert werden, die schwer zu manipulieren sind?Liegt es an den Kosten des Programms?

F-Statistiken können aus einer beliebigen Anzahl bestimmter Tests entstehen.Das F ist nur eine Verteilung (lose:eine Beschreibung der „Häufigkeiten“ von Wertegruppen), wie eine Normale (Gaußsche) oder Uniform.Im Allgemeinen ergeben sie sich aus Varianzverhältnissen.Meinung:Viele Statistiker (ich eingeschlossen) halten F-basierte Tests für instabil (Fachjargon:nicht-robust).

Die jeweiligen Ausgabestatistiken (Pillai-Spur usw.) legen nahe, dass es sich bei der ursprünglichen Analyse um ein MANOVA-Beispiel handelt, das, wie andere Poster beschreiben, ein kompliziertes und schwer zu findendes Verfahren ist.

Ich vermute auch, dass es sich aufgrund der MANOVA und der Verwendung von SPSS um ein Psychologie- oder Soziologieprojekt handelt ...Wenn nicht, bitte um Aufklärung.Es könnte sein, dass andere, einfachere Modelle tatsächlich leichter zu verstehen und reproduzierbarer sind.Wenden Sie sich an die statistische Beratungsgruppe Ihrer örtlichen Universität, sofern Sie eine haben.

Viel Glück!

Hier ist eine Erklärung der MANOVA-Ausgabe von einer sehr guten Website zum Thema Statistik und SPSS:

Ausgabe mit Erklärung:http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Wie und warum man MANOVA oder multivariates GLM durchführt:(gleicher Pfad wie oben, endet jedoch in „/manova.htm“)

Es wäre sowohl langwierig als auch schwierig, eine Software von Grund auf zu schreiben, um diese Ergebnisse zu berechnen.Es gibt viele numerische Probleme und Matrixinversionen zu lösen.

Wie Henry sagte, verwenden Sie Python-Skripte oder R.Ich würde vorschlagen, mit jemandem zusammenzuarbeiten, der sich mit SPSS auskennt, wenn es um Skripterstellung geht.Darüber hinaus ist SPSS selbst in der Lage, die Ausgabetabellen mithilfe eines sogenannten OMS in Dateien zu exportieren.Ein Skript innerhalb von SPSS kann dies tun.

Finden Sie heraus, wer in Ihrer Forschungsgruppe SPSS kennt und arbeiten Sie mit ihnen zusammen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top