我有一个数据帧,即df:
df =
0.49
0.31
0.01
0.1
0.7
0.71
0.24
0.05
0.75
0.79
0.15
0.29
0.34
0.17
0.1
我希望在其5%的显着性水平上找到一个临界值。
例如,如果0.2是5%显着水平的临界值,我会说低于0.2的值没有统计学意义。 pandas dataframe或python中是否有任何函数可以找到这样的阈值或临界值?感谢。
答案 0 :(得分:0)
您提供的内容对我来说似乎不是一个数据帧。也许以下代码可以让您走上正轨:
#create random data and their critical values
import random
df = pd.DataFrame({"Value": pd.Series(random.sample(range(0,100),15)),
"Critical": pd.Series(random.sample(range(100,3000),15))})[["Value","Critical"]]
# print whole dataframe
print df
Value Critical
0 78 966
1 18 1595
2 88 963
3 24 2927
4 47 1082
5 26 2425
6 36 2847
7 0 143
8 73 1205
9 65 638
10 92 341
11 27 213
12 21 1531
13 44 590
14 28 584
# select only those with value bigger that 5% of its critical value
df = df[df["Value"]>df["Critical"]*0.05]
# print criticals only
print df
Value Critical
0 78 966
2 88 963
8 73 1205
9 65 638
10 92 341
11 27 213
13 44 590