民间
我有建筑物中任何区域的温度数据,如下所示:
Lines <- "Date,Zone01,Zone02
01/01 01:00:00,24.5,21.3
01/01 02:00:00,24.3,21.1
01/01 03:00:00,24.1,21.1
01/01 04:00:00,24.1,20.9
01/01 05:00:00,25.,21.
01/01 06:00:00,26.,21.
01/01 07:00:00,26.6,22.3
01/01 08:00:00,28.,24.
01/01 09:00:00,28.9,26.5
01/01 10:00:00,29.4,29
01/01 11:00:00,30.,32.
01/01 12:00:00,33.,35.
01/01 13:00:00,33.4,36
01/01 14:00:00,35.8,38
01/01 15:00:00,32.3,37
01/01 16:00:00,30.,34.
01/01 17:00:00,29.,33.
01/01 18:00:00,28.,32.
01/01 19:00:00,26.3,30
01/01 20:00:00,26.,28.
01/01 21:00:00,25.9,25
01/01 22:00:00,25.8,21.3
01/01 23:00:00,25.6,21.4
01/01 24:00:00,25.5,21.5
01/02 01:00:00,25.4,21.6
01/02 02:00:00,25.3,21.8"
我想要做的是计算每个区域的第99个百分点的温度。我会做这个命令:
Q=quantile(Lines$Zone01,0.99)
但是我必须手动为数据集中的每一列进行操作。有没有办法让这个命令遍历所有列(从第二列开始)?
非常感谢。
答案 0 :(得分:7)
使用apply
系列中的一项功能,在本例中为sapply
:
> sapply(Lines[, -1], quantile, 0.99)
Zone01.99% Zone02.99%
35.20 37.75
您会注意到这样做的结果是quantile
会附加到列名称。要删除此内容,请将names=FALSE
作为参数传递给quantile
:
> sapply(Lines[, -1], quantile, 0.99, names=FALSE)
Zone01 Zone02
35.20 37.75
答案 1 :(得分:5)
包plyr
有一个名为numcolwise
的漂亮函数,如果它是数字,它将对数据框的每一列进行操作。类似的东西:
library(plyr)
> numcolwise(function(x) quantile(x, .99))(dat)
Zone01 Zone02
99% 35.2 37.75
应该做的伎俩。
当然,您始终可以使用基本申请系列:
> apply(dat[, -1], 2, function(x) quantile(x, .99))
Zone01 Zone02
35.20 37.75
答案 2 :(得分:3)
假设您的数据位于data.frame中,您可以将带有温度数据的列转换为矩阵并使用apply(matrix,2,quantile,0.99)