Domanda

Ho una domanda molto semplice. Qual è la base del normale diagramma di probabilità, cioè cosa rappresentano le probabilità? Sto testando una distribuzione normale standard. Mio NormPlot (in Matlab) ha rivelato che i valori erano più o meno in linea retta ma la probabilità di 0,5 corrispondeva a un valore diverso da zero.

La mia domanda è: come posso interpretarlo? Ciò significa che i miei dati sono normalmente distribuiti ma hanno una media diversa da zero (cioè non standard normale) o questa probabilità riflette solo qualcos'altro? Ho provato Google e un link ha detto che le probabilità sono le probabilità cumulative dal tavolo Z e non riesco a capire cosa farne.

Anche in Matlab, fintanto che i valori si adattano alla linea tracciati dal programma (la linea rossa tratteggiata) i valori provengono da una distribuzione normale? In uno dei miei grafici, la linea tratteggiata è molto ripida ma i valori si adattano, questo significa che uno o due valori che sono molto al di fuori di questa linea sono solo valori anomali?

Sono molto nuovo alle statistiche, quindi per favore aiutatemi!

Grazie!

È stato utile?

Soluzione

La mia domanda è: come posso interpretarlo? Ciò significa che i miei dati sono normalmente distribuiti ma hanno una media diversa da zero (cioè non standard normale) o questa probabilità riflette solo qualcos'altro?

Hai ragione. Se si esegue NormPlot e ottieni i dati molto vicini alla linea montata, ciò significa che i tuoi dati hanno un funzione di distribuzione cumulativa Questo è molto vicino a una distribuzione normale. Il punto 0,5 CDF corrisponde al valore medio della distribuzione normale adattata. (Sembra circa 0,002 nel tuo caso)

Il motivo per cui ottieni una linea retta è che l'asse y non è lineare ed è fatto per essere "deformato" in modo tale che una perfetta distribuzione cumulativa gaussiana mappasse in una linea: i segni dell'asse y sono lineari con l'inverso funzione di errore.

Quando guardi le estremità e hanno pendenze più ripide rispetto alla linea montata, ciò significa che la tua distribuzione ha code più brevi di una distribuzione normale, cioè ci sono meno valori anomali, forse a causa di un vincolo fisico che impedisce un'eccessiva variazione dalla media.

Altri suggerimenti

La distribuzione normale è una funzione di densità. La probabilità di qualsiasi singolo valore sarà 0. Questo perché si dispone della probabilità totale (= 1) distribuita tra un numero infinito di valori (è una funzione continua).

Quello che hai lì nel grafico (della distribuzione normale) è il modo in cui la probabilità è distribuita (asse y) attorno ai valori (asse x). Quindi ciò che puoi ottenere dal grafico è la probabilità di un intervallo tra 2 punti, da -infinite a qualsiasi punto o da qualsiasi punto a +infinte. Questa probabilità è ottenuta integrando la funzione (della distribuzione normale) definita da Point1 a Point2.

Ma non devi fare questo integrale poiché hai il tavolo Z. La tabella z ti dà la probabilità che x sia tra -infinite e x (ad esempio l'equazione che racconta da x a z)

Non ho Matlab qui, ma immagino che la linea retta che menziona sia la funzione di distribuzione cumulativa, che ti dice la probabilità di x tra [-infinite, x], ed è determinata dalla somma (o integrale in questo caso) da -infinite al valore di x (o ottenuto nella tabella z)

Scusa se il mio inglese era cattivo. Spero di essere stato utile.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top