Come faccio a calcolare queste statistiche?

https://stackoverflow.com/questions/1679

08-06-2019
|

Domanda

Sto scrivendo un'applicazione per facilitare alcune ricerche, e una parte di questa si tratta di fare alcuni calcoli statistici.Ora, i ricercatori stanno utilizzando un programma chiamato SPSS.Una parte della produzione che si preoccupano di simile a questo:

[Part of the SPSS output

Sono davvero preoccupato solo il F e Sig. valori.Il mio problema è che non hanno alcun background in statistica, e io non riesco a capire che cosa i test sono chiamati, o come calcolarle.

Ho pensato che la F il valore potrebbe essere il risultato di F-test, ma dopo aver seguito la procedura descritta su Wikipedia, ho ottenuto un risultato diverso da quello che SPSS dà.

Soluzione

Questo sito potrebbe aiutarti un po ' di più.Anche questo.

Sto lavorando da un abbastanza arrugginito memoria di una statistica corso, ma qui va niente:

Quando si fa l'analisi della varianza (ANOVA), in realtà si calcola la statistica F come rapporto tra la media-piazza variazioni "tra i gruppi" e il mean-square varianze "all'interno dei gruppi".Il secondo link sopra mi sembra abbastanza buono per questo calcolo.

Questo rende la statistica F misurare esattamente quanto sia potente il tuo modello è, perché "tra i gruppi" varianza è la potenza esplicativa, e "all'interno dei gruppi di" varianza è l'errore casuale.Alto F implica un altamente significativo modello.

Come in molte operazioni statistiche, si torna a determinare il Sig.utilizza la statistica F.Qui è dove la vostra informazioni da Wikipedia viene leggermente a portata di mano.Che cosa si desidera fare utilizzando i gradi di libertà dato da SPSS - di trovare il corretto valore di P in cui un F tabella vi darà la statistica F è calcolato.Il valore di P in cui questo accade, [F(tavolo) = F(calcolata)] è il significato.

Concettualmente, una bassa significatività valore indica una forte capacità di rifiutare l'ipotesi nulla (che per questi scopi mezzo per determinare il tuo modello ha la potenza esplicativa).

Mi dispiace matematiche gente, se tutto questo è sbagliato.Sarò il controllo indietro per apportare modifiche!!!

Buona fortuna a voi.Le statistiche è divertente, solo forse non questa parte.=)

Altri suggerimenti

Presumo dalla tua domanda che la tua ricerca colleghi che si desidera automatizzare il processo mediante il quale alcune analisi statistiche eseguite (cioè, vogliono batch processo di set di dati).Hai due opzioni:

1) SPSS è ora di script tramite python (versione 15) - andare a spss.com e di ricerca per python.È possibile scrivere script in python per automatizzare l'analisi di dati ed estrarre la chiave di valori da tabelle pivot, e quindi elaborare le risposte in qualsiasi modo che ti piace.Questo ha il vantaggio di permettere un esatto confronto tra i risultati dal tuo script python e la mano calcolato sforzi in SPSS dei vostri collaboratori.In questo modo non dovrete per conoscere tutte le statistiche per fare questo lavoro (che è un vantaggio chiave)

2) Si potrebbe fare questo in R, gratuitamente le statistiche ambiente, che, probabilmente, poteva essere scritto.Questo ha lo svantaggio che si dovrà imparare statistiche al fine di garantire che si sta facendo correttamente.

Le statistiche è difficile :-).Dopo un anno di lettura e ri-lettura di libri e giornali e posso solo dire con certezza che ho capito le basi di esso.

Si potrebbe desiderare di indagare ready-made librerie per qualsiasi linguaggio di programmazione che si sta utilizzando, perché sono molti gotcha in matematica in generale e statistiche, in particolare (errori di arrotondamento essere un esempio evidente).

Come esempio, si potrebbe dare un'occhiata a il progetto R, che sia un ambiente interattivo e una libreria che è possibile utilizzare il vostro codice C++, distribuito sotto licenza GPL (vale a dire, se lo si usa solo internamente e pubblicare solo i risultati, non c'è bisogno di aprire il tuo codice).

In breve:non fare questo a mano, link/utilizzo di software esistente.E sain_grocen la risposta non è corretta.:(

Questi sono tutti i test per la significatività delle stime dei parametri che sono tipicamente utilizzati in Multivariata risposta analisi di Regressione Multipla.Questi non sarebbero semplici cose da fare al di fuori di un ambiente statistico di programmazione.Vorrei suggerire sia sempre l'uscita di un pre-esistente di un programma di statistica, o l'utilizzo di uno che è possibile collegare e utilizzare il codice.

Ho paura che la prima risposta (sain_grocen) dovranno portare giù la strada sbagliata.La sua spiegazione è, probabilmente, un caso particolare di quello che in realtà si sta trattando.L'anova ha spiegato nel suo link è per una singola variabile di risposta, in un design equilibrato.Queste non sono le F le statistiche si sta vedendo.I nomi in uscita (Pillai di Traccia, di Hotelling Traccia,...) sono disponibili multivariata versioni.Hanno F distribuzioni sotto alcune ipotesi.Non si può spiegare una parte dei libri di testo che vale la pena di materiale qui, ti consiglio di iniziare a guardare "Domanda di Analisi Statistica Multivariata" di Johnson e Wichern

Si può spiegare di più perché SPSS in sé non è una bella soluzione al problema?È che genera le tabelle pivot come output, che sono difficili da manipolare?È il costo del programma?

F-statistiche possono derivare da un qualsiasi numero di particolari test.La F è solo una distribuzione (liberamente:una descrizione delle "frequenze" di gruppi di valori), come un Normale (Gaussiana), o Uniforme.In generale, essi derivano da rapporti di varianze.Parere:molti statistici (me compreso), trovare F-test per essere instabile (in gergo:nonrobusto).

La particolare uscita statistiche (Pillai traccia, etc.) suggeriscono che l'analisi originale è una MANOVA esempio, che come altri manifesti descrivere è un complicato e complessa procedura.

Scommetto anche che, sulla base della MANOVIA, e l'uso di SPSS, questa è una psicologia o sociologia progetto...se non, si prega di illuminare.Potrebbe essere che gli altri, i modelli più semplici potrebbe in realtà essere più facile da capire e più ripetibile.Consultare il vostro locale università statistici consulting group, se si dispone di uno.

Buona fortuna!

Ecco una spiegazione di MANOVA ouptput, da un sito molto buono su statistiche e su SPSS:

Uscita con la spiegazione:http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Come e perché fare MANOVIA o multivariata GLM:(stesso percorso come sopra, ma terminanti in '/manova.htm')

Il software di scrittura da zero per calcolare queste uscite sarebbe lungo e difficile;c'è un sacco di problemi numerici e matrice inversions messicano per fare.

Henry ha detto, usare script Python, o R.Vorrei suggerire di lavorare con qualcuno che conosce SPSS se lo scripting.Inoltre, SPSS stesso è in grado di esportare le tabelle di output per i file usando una cosa chiamata OMS.Uno script all'interno di SPSS può fare questo.

Scoprire che nel vostro gruppo di ricerca sa SPSS e lavorare con loro.

Autorizzato sotto: CC-BY-SA insieme a attribuzione

Non affiliato a StackOverflow