如何找到峰值/行号?

时间:2009-10-16 05:19:00

标签: r subset

我有一个大型数据集(202k点)。我知道有超过0.5的8个值。我想在这些行上进行子集化。

如何查找/返回值为>的行号列表? 0.5

4 个答案:

答案 0 :(得分:5)

如果数据集是名为x的矢量:

(1:length(x))[x > 0.5]

如果数据集是名为x的data.frame或矩阵,并且感兴趣的变量位于j列中:

(1:nrow(x))[x[,j] > 0.5]

但是如果你只想找到子集并且不需要行号,请使用

subset(x, x > 0.5)

表示矢量和

subset(x, x[,j] > 0.5)

表示矩阵或data.frame。

答案 1 :(得分:2)

which(x > 0.5)

答案 2 :(得分:0)

这是一些虚拟数据:

D<-matrix(c(0.6,0.1,0.1,0.2,0.1,0.1,0.23,0.1,0.8,0.2,0.2,0.2),nrow=3)

看起来像:

> D
     [,1] [,2] [,3] [,4]
[1,]  0.6  0.2 0.23  0.2
[2,]  0.1  0.1 0.10  0.2
[3,]  0.1  0.1 0.80  0.2

这是逻辑行索引,

index <- (rowSums(D>0.5))>=1

您可以使用它来提取所需的行:

PeakRows <- D[index,]

看起来像这样:

> PeakRows
     [,1] [,2] [,3] [,4]
[1,]  0.6  0.2 0.23  0.2
[2,]  0.1  0.1 0.80  0.2

答案 3 :(得分:0)

将参数arr.ind=TRUEwhich一起使用是查找条件为TRUE的行(或列)数字的好方法,

df <- matrix(c(0.6,0.2,0.1,0.25,0.11,0.13,0.23,0.18,0.21,0.29,0.23,0.51), nrow=4)

#      [,1] [,2] [,3]
# [1,] 0.60 0.11 0.21
# [2,] 0.20 0.13 0.29
# [3,] 0.10 0.23 0.23
# [4,] 0.25 0.18 0.51
带有which

arr.ind=TRUE返回条件为TRUE的数组索引

which(df > 0.5, arr.ind=TRUE)
     row col
[1,]   1   1
[2,]   4   3

所以子集变为

df[-which(df > 0.5, arr.ind=TRUE)[, "row"], ]

#      [,1] [,2] [,3]
# [1,]  0.2 0.13 0.29
# [2,]  0.1 0.23 0.23