题
我有400,000行,每行都有ID,试验数和成功数量。
我有(一个)p的值,这是成功的假设概率。
我想使用其试验成功和全局p来计算每行的精确,二项式,单侧的p值。
例如,
1001 10 2
应该给我
1001 10 2 2.639011E-01,对于2个成功或更多成功的概率。
我更喜欢SAS中的解决方案,但是SPSS也很有用。
谢谢!
解决方案
您可以直接使用二项式分布:
data yourdata;
set yourdata;
p_lower = PROBBNML(globalp, ntrials, nsuccesses);
p_higher = 1 - PROBBNML(globalp, ntrials, nsuccesses-1);
run;
我尚未测试probBNML是否可以与-1响应一起使用,因此您可能需要测试 nsuccesses=0
使用之前 p_higher
公式。
不隶属于 StackOverflow