calcular la probabilidad y dibujar un cdf en Excel
Pregunta
Ahora tengo una columna de datos como esta:
0.000000
0.000000
0.000000
0.000000
0.024995
0.024996
0.024996
0.024997
0.024997
0.024997
0.024997
0.025004
0.025010
0.025011
0.025996
0.025996
0.025996
Primero quiero calcular la probabilidad acumulada de estos datos y mostrarlos en la columna B, luego basándome en las columnas A y B, para dibujar un gráfico CDF.
¿Alguien sabe qué fórmula debo usar?
Solución
En la celda a la izquierda de la primera entrada (B1 en mi ejemplo), ingrese lo siguiente:
=COUNT(A$1:A1)/COUNT($A$1:$A$17)
Luego, complete esto en la columna.
Para crear el gráfico CDF, cree un diagrama de dispersión (con líneas interpoladas) con valores x =A1:A17
y valores y =B1:B17
.
Nota:
Dado que tiene varios valores duplicados al comienzo de sus datos, es posible que desee trazar solo el valor x =A4:A17
y los valores y =B4:B17
.Esto realmente depende de la naturaleza de su variable.Puede hacerlo de esta manera si está claro que el valor mínimo posible es cero.
Otros consejos
Supongo que los números que proporciona son una Función de densidad de probabilidad (PDF) y que desea calcular una Función de distribución acumulativa (CDF) a partir de ese PDF. En ese caso ...
B1 simplemente sería =A1
. B2 =B1+A2
, B3 =B2+A3
, etc. Luego, resalte los datos en la columna B, haga clic en la pestaña "Insertar" y seleccione un gráfico de líneas. Alternativamente, puede hacerlo en B1 =SUM(A$1:A1)
y completar.
Por cierto, los CDF suelen aumentar de forma monótona entre 0 y 1. Su PDF no genera un CDF que llegue hasta 1. Por lo tanto, si esto es lo que busca, o no está enumerando todos de los datos en su PDF, o necesita escalar las cosas de manera un poco diferente. Puede dividir cada elemento en la columna A por la suma de esos elementos, y eso sumará 1. Sin embargo, si todo lo que desea es un CDF correctamente definido, puede hacerlo directamente configurando B1 =SUM(A$1:A1)/SUM(A:A)
y nuevamente complete.