Question

我有2个数据集。第一个数据集的p值为0.5 - 0.001，以及满足该p值的相应阈值。例如，对于0.05，值为13.任何大于13的值具有<0.05的p值。这个数据集包含了我感兴趣的所有阈值。就像这样：

     V1       V2
1 0.500       10
2 0.200       11
3 0.100       12
4 0.050       13
5 0.010       14
6 0.001       15

第二个数据集只是一个很长的值列表。我需要编写一个R脚本来计算此集合中超过每个阈值的值的数量。例如，计算第二个数据集中超过13的值，因此p值<0.05，并在每个阈值之前执行此操作。

以下是第二组数据的前15个值（总共1000个）：

1    11.100816
2     8.779858
3    10.510090
4     9.503772
5     9.392222
6    10.285920
7     8.317523
8    10.007738
9    11.021283
10    9.964725
11    9.081947
12   11.253643
13   10.896120
14   10.272814
15   10.282408

Answer 1

功能which可以帮助您：

length( which( data$V1 > 3 & data$V2 <0.05 ) )

Answer 2

假设dat1和dat2都有V2列，如下所示：

colSums(outer(dat2$V2, setNames(dat1$V2, dat1$V2), ">"))

# 10 11 12 13 14 15 
#  9  3  0  0  0  0

（如下所示：9项的值大于10，3项的值大于11等。）

计算数据集中超过R的阈值的值

2 个答案: