在R中执行逐列操作

时间:2011-10-04 13:00:46

标签: r loops quantile

民间

我有建筑物中任何区域的温度数据,如下所示:

Lines <- "Date,Zone01,Zone02
 01/01  01:00:00,24.5,21.3
 01/01  02:00:00,24.3,21.1
 01/01  03:00:00,24.1,21.1
 01/01  04:00:00,24.1,20.9
 01/01  05:00:00,25.,21.
 01/01  06:00:00,26.,21.
 01/01  07:00:00,26.6,22.3
 01/01  08:00:00,28.,24.
 01/01  09:00:00,28.9,26.5
 01/01  10:00:00,29.4,29
 01/01  11:00:00,30.,32.
 01/01  12:00:00,33.,35.
 01/01  13:00:00,33.4,36
 01/01  14:00:00,35.8,38
 01/01  15:00:00,32.3,37
 01/01  16:00:00,30.,34.
 01/01  17:00:00,29.,33.
 01/01  18:00:00,28.,32.
 01/01  19:00:00,26.3,30
 01/01  20:00:00,26.,28.
 01/01  21:00:00,25.9,25
 01/01  22:00:00,25.8,21.3
 01/01  23:00:00,25.6,21.4
 01/01  24:00:00,25.5,21.5
 01/02  01:00:00,25.4,21.6
 01/02  02:00:00,25.3,21.8"

我想要做的是计算每个区域的第99个百分点的温度。我会做这个命令:

Q=quantile(Lines$Zone01,0.99)

但是我必须手动为数据集中的每一列进行操作。有没有办法让这个命令遍历所有列(从第二列开始)?

非常感谢。

3 个答案:

答案 0 :(得分:7)

使用apply系列中的一项功能,在本例中为sapply

> sapply(Lines[, -1], quantile, 0.99)
Zone01.99% Zone02.99% 
     35.20      37.75 

您会注意到这样做的结果是quantile会附加到列名称。要删除此内容,请将names=FALSE作为参数传递给quantile

> sapply(Lines[, -1], quantile, 0.99, names=FALSE)
Zone01 Zone02 
 35.20  37.75 

答案 1 :(得分:5)

plyr有一个名为numcolwise的漂亮函数,如果它是数字,它将对数据框的每一列进行操作。类似的东西:

library(plyr)
> numcolwise(function(x) quantile(x, .99))(dat)
    Zone01 Zone02
99%   35.2  37.75

应该做的伎俩。

当然,您始终可以使用基本申请系列:

> apply(dat[, -1], 2, function(x) quantile(x, .99)) 
Zone01 Zone02 
 35.20  37.75

答案 2 :(得分:3)

假设您的数据位于data.frame中,您可以将带有温度数据的列转换为矩阵并使用apply(matrix,2,quantile,0.99)