Pregunta

Tengo 400.000 filas, cada una con un id, número de ensayos, y el número de éxitos.

Tengo (un) valor para p, una probabilidad hipotética de éxito.

Me gustaría calcular una exacta, binomial, unilateral p-valor para cada fila, con sus éxitos ensayos, y el p global.

por ejemplo.,

1001 10 2

debe me

dar

1001 10 2 2.639011e-01 para la probabilidad de 2 éxitos o más.

Yo prefiero una solución de SAS, SPSS, pero también es útil.

Gracias!

¿Fue útil?

Solución

Se puede utilizar la distribución binomial directamente:

data yourdata;
   set yourdata;
   p_lower = PROBBNML(globalp, ntrials, nsuccesses);
   p_higher = 1 - PROBBNML(globalp, ntrials, nsuccesses-1);
run;

No he probado si PROBBNML trabajará con -1 respuestas, por lo que puede que tenga que prueba para nsuccesses=0 antes de usar la fórmula p_higher.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top