我有400,000行,每行有一个id,试验次数和成功次数。
我有一个p值,一个假设的成功概率。
我想计算每行的精确,二项式,单侧p值,使用其试验成功和全局p。
,例如,
1001 10 2
应该给我
1001 10 2 2.639011e-01表示成功概率为2次或以上。
我更喜欢SAS的解决方案,但SPSS也很有用。
谢谢!
答案 0 :(得分:3)
您可以直接使用二项分布:
data yourdata;
set yourdata;
p_lower = PROBBNML(globalp, ntrials, nsuccesses);
p_higher = 1 - PROBBNML(globalp, ntrials, nsuccesses-1);
run;
我还没有测试PROBBNML是否可以使用-1响应,所以在使用nsuccesses=0
公式之前,您可能需要测试p_higher
。