Pergunta

este

SELECT 
AVG(s.Amount/100)[Avg],
STDEV(s.Amount/100) [StDev],
VAR(s.Amount/100) [Var]

Retorna isto:

Avg StDev           Var
133 550.82021581146 303402.910146583

As estatísticas não são o meu processo mais forte, mas como é possível que o desvio e a variação padrão sejam maiores que a média? Não apenas isso, mas a variação é quase 100x maior que a maior amostra no conjunto.

Aqui está todo o conjunto de amostras, com o acima substituído por

SELECT s.Amount/100

enquanto o resto da consulta é idêntico

Amount
4645
3182
422
377
359
298
278
242
230
213
182
180
174
166
150
130
116
113
109
107
102
96
84
78
78
76
66
64
61
60
60
60
59
59
56
49
46
41
41
39
38
36
29
27
26
25
25
25
24
24
24
22
22
22
20
20
19
19
19
19
19
18
17
17
17
16
14
13
12
12
12
11
11
10
10
10
10
9
9
9
8
8
8
7
7
6
6
6
3
3
3
3
2
2
2
2
2
1
1
1
1
1

1

Foi útil?

Solução

Você precisa ler um livro sobre estatísticas ou pelo menos começar com as páginas da Wikipedia que descrevem os conceitos.

O desvio padrão e a variação estão muito relacionados. A variação é o quadrado (ou próximo o suficiente para o quadrado) do desvio padrão. Você pode verificar se isso é verdade para seus números.

Não existe realmente uma relação entre o desvio padrão e a média. O desvio padrão está medindo a dispersão dos dados em torno da média. Os dados podem ser arbitrariamente dispersos em torno de uma média.

Você pode estar confuso porque existem estimativas sobre desvio padrão/erro padrão quando assume uma distribuição específica dos dados. No entanto, essas estimativas são sobre a distribuição e não sobre os dados.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top