对R中的特定行进行计算

时间:2015-04-16 22:55:37

标签: r loops subset

我是R的新手,尝试过很多东西但是没有用。我的表看起来像这样:

data temp
11.01.15 11am 15 
11.01.15 12am 16
11.01.15 13am 14
12.01.15 11am 13
12.01.15 12am 11
12.01.15 13am 11

它继续5192行和很多天,我必须计算当天的平均值,测量总是每天进行3次。所以我需要一个循环来计算1-3行,4-6行,7-9行等的值的平均值,并跟踪它们并保存在文件中。

3 个答案:

答案 0 :(得分:1)

如果您总是有3个观察值,则可以在3个模块上计算temp的平均值。假设您的数据名为df

tapply(df$temp, cumsum(seq(nrow(df)) %% 3 == 1L), mean)
#        1        2 
# 15.00000 11.66667 

另一种方法是将data转换为Date类,并计算其平均值。以下是使用data.table

的示例
library(data.table)
setDT(df)[, mean(temp), by = as.Date(data, "%d.%m.%y")]
#       as.Date       V1
# 1: 2015-01-11 15.00000
# 2: 2015-01-12 11.66667

答案 1 :(得分:0)

使用dplyr包及其功能。我猜你有一个名为“day”或“date”的变量,你想要的另一个变量“x”意味着。代码:

group_by(data, day) %>% 
  summarize(meanX = mean(x))

将返回名为data的数据集中每天平均值为x的数据帧。

答案 2 :(得分:0)

您可以使用lapply来执行此操作

req.out = do.call(rbind, 
          lapply(split(data, f = data$date), 
          function(x){
          out = mean(x$measurement)
          }))

其中,数据是您的数据框,其中包含您需要计算平均值的日期和列(我将其称为上面的度量)。