Domanda

Ho 400.000 di righe, ciascuna con un id, numero di prove, e il numero di successi.

ho (uno) rapporto qualità-p, una probabilità ipotizzata di successo.

Mi piacerebbe calcolare un esatto, binomiale, unilaterale p-value per ogni riga, utilizzando le prove successi, e il p globale.

per es.,

1001 10 2

dovrebbe me

dare

1001 10 2 2.639011e-01 per la probabilità di 2 successi o più.

preferirei una soluzione in SAS, SPSS, ma è anche utile.

Grazie!

È stato utile?

Soluzione

È possibile utilizzare la distribuzione binomiale direttamente:

data yourdata;
   set yourdata;
   p_lower = PROBBNML(globalp, ntrials, nsuccesses);
   p_higher = 1 - PROBBNML(globalp, ntrials, nsuccesses-1);
run;

Non ho ancora testato se PROBBNML lavorerà con -1 risposte, quindi potrebbe essere necessario per verificare nsuccesses=0 prima di utilizzare la formula p_higher.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top