我有2个数据集。第一个数据集的p值为0.5 - 0.001,以及满足该p值的相应阈值。例如,对于0.05,值为13.任何大于13的值具有<0.05的p值。这个数据集包含了我感兴趣的所有阈值。就像这样:
V1 V2
1 0.500 10
2 0.200 11
3 0.100 12
4 0.050 13
5 0.010 14
6 0.001 15
第二个数据集只是一个很长的值列表。我需要编写一个R脚本来计算此集合中超过每个阈值的值的数量。例如,计算第二个数据集中超过13的值,因此p值<0.05,并在每个阈值之前执行此操作。
以下是第二组数据的前15个值(总共1000个):
1 11.100816
2 8.779858
3 10.510090
4 9.503772
5 9.392222
6 10.285920
7 8.317523
8 10.007738
9 11.021283
10 9.964725
11 9.081947
12 11.253643
13 10.896120
14 10.272814
15 10.282408
答案 0 :(得分:6)
功能which
可以帮助您:
length( which( data$V1 > 3 & data$V2 <0.05 ) )
答案 1 :(得分:2)
假设dat1
和dat2
都有V2
列,如下所示:
colSums(outer(dat2$V2, setNames(dat1$V2, dat1$V2), ">"))
# 10 11 12 13 14 15
# 9 3 0 0 0 0
(如下所示:9
项的值大于10
,3
项的值大于11
等。)