Вопрос

У меня есть 400 000 рядов, каждый с идентификатором, количеством испытаний и количество успехов.

У меня есть (одна) значение для P, предполагаемая вероятность успеха.

Я хотел бы рассчитать точное, биномичное одностороннее значение P-значение для каждого ряда, используя успехи испытаний, а также глобальные р.

Например,

1001 10 2

должен дать мне

1001 10 2 2.639011E-01 для вероятности 2 успехов или более.

Я бы предпочел решение в SAS, но SPSS также полезен.

Спасибо!

Это было полезно?

Решение

Вы можете использовать биномиальное распределение напрямую:

data yourdata;
   set yourdata;
   p_lower = PROBBNML(globalp, ntrials, nsuccesses);
   p_higher = 1 - PROBBNML(globalp, ntrials, nsuccesses-1);
run;

Я не проверил, будет ли проббнмл работать с -1 ответами, поэтому вам может потребоваться проверить для nsuccesses=0 перед использованием p_higher Формула.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top