计算数据集中超过R的阈值的值

时间:2014-05-26 14:13:24

标签: r

我有2个数据集。第一个数据集的p值为0.5 - 0.001,以及满足该p值的相应阈值。例如,对于0.05,值为13.任何大于13的值具有<0.05的p值。这个数据集包含了我感兴趣的所有阈值。就像这样:

     V1       V2
1 0.500       10
2 0.200       11
3 0.100       12
4 0.050       13
5 0.010       14
6 0.001       15

第二个数据集只是一个很长的值列表。我需要编写一个R脚本来计算此集合中超过每个阈值的值的数量。例如,计算第二个数据集中超过13的值,因此p值<0.05,并在每个阈值之前执行此操作。

以下是第二组数据的前15个值(总共1000个):

1    11.100816
2     8.779858
3    10.510090
4     9.503772
5     9.392222
6    10.285920
7     8.317523
8    10.007738
9    11.021283
10    9.964725
11    9.081947
12   11.253643
13   10.896120
14   10.272814
15   10.282408

2 个答案:

答案 0 :(得分:6)

功能which可以帮助您:

length( which( data$V1 > 3 & data$V2 <0.05 ) )

答案 1 :(得分:2)

假设dat1dat2都有V2列,如下所示:

colSums(outer(dat2$V2, setNames(dat1$V2, dat1$V2), ">"))

# 10 11 12 13 14 15 
#  9  3  0  0  0  0 

(如下所示:9项的值大于103项的值大于11等。)