我是R的新手,尝试过很多东西但是没有用。我的表看起来像这样:
data temp
11.01.15 11am 15
11.01.15 12am 16
11.01.15 13am 14
12.01.15 11am 13
12.01.15 12am 11
12.01.15 13am 11
它继续5192行和很多天,我必须计算当天的平均值,测量总是每天进行3次。所以我需要一个循环来计算1-3行,4-6行,7-9行等的值的平均值,并跟踪它们并保存在文件中。
答案 0 :(得分:1)
如果您总是有3个观察值,则可以在3个模块上计算temp
的平均值。假设您的数据名为df
tapply(df$temp, cumsum(seq(nrow(df)) %% 3 == 1L), mean)
# 1 2
# 15.00000 11.66667
另一种方法是将data
转换为Date
类,并计算其平均值。以下是使用data.table
library(data.table)
setDT(df)[, mean(temp), by = as.Date(data, "%d.%m.%y")]
# as.Date V1
# 1: 2015-01-11 15.00000
# 2: 2015-01-12 11.66667
答案 1 :(得分:0)
使用dplyr
包及其功能。我猜你有一个名为“day”或“date”的变量,你想要的另一个变量“x”意味着。代码:
group_by(data, day) %>%
summarize(meanX = mean(x))
将返回名为data
的数据集中每天平均值为x的数据帧。
答案 2 :(得分:0)
您可以使用lapply来执行此操作
req.out = do.call(rbind,
lapply(split(data, f = data$date),
function(x){
out = mean(x$measurement)
}))
其中,数据是您的数据框,其中包含您需要计算平均值的日期和列(我将其称为上面的度量)。