我有400,000行,每行都有ID,试验数和成功数量。

我有(一个)p的值,这是成功的假设概率。

我想使用其试验成功和全局p来计算每行的精确,二项式,单侧的p值。

例如,

1001 10 2

应该给我

1001 10 2 2.639011E-01,对于2个成功或更多成功的概率。

我更喜欢SAS中的解决方案,但是SPSS也很有用。

谢谢!

有帮助吗?

解决方案

您可以直接使用二项式分布:

data yourdata;
   set yourdata;
   p_lower = PROBBNML(globalp, ntrials, nsuccesses);
   p_higher = 1 - PROBBNML(globalp, ntrials, nsuccesses-1);
run;

我尚未测试probBNML是否可以与-1响应一起使用,因此您可能需要测试 nsuccesses=0 使用之前 p_higher 公式。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top