我需要创建一个对象来计算和存储过去两年中每个月中网格中14个节点的3组电价(峰值,非峰值和平均日)年份。我认为嵌入式列表数据结构是合适的(如果这不是最优的,请纠正我)。
在任何情况下,我都不喜欢使用for循环来创建这个结构。如果有一种优雅的方式来做到这一点,我将不胜感激,如果有人可以帮助引导我朝着正确的方向前进。我试图练习和改进我的编码。谢谢。
hb_lz_names <- c("HB_BUSAVG", "HB_HOUSTON", "HB_HUBAVG", "HB_NORTH", "HB_SOUTH",
"HB_WEST", "LZ_AEN", "LZ_CPS", "LZ_HOUSTON", "LZ_LCRA", "LZ_NORTH",
"LZ_RAYBN", "LZ_SOUTH", "LZ_WEST")
power_price <- list()
for (i in 1:2){
power_price[[i]] <- list()
for (j in 1:12){
power_price[[i]][[j]] <- list()
for (k in 1:NROW(hb_lz_names)) {
power_price[[i]][[j]][[k]] <- list()
for (l in 1:3){
power_price[[i]][[j]][[k]][[l]] <- l
}
names(power_price[[i]][[j]][[k]]) <- c("on-peak", "off-peak", "average")
}
names(power_price[[i]][[j]]) <- hb_lz_names
}
names(power_price[[i]]) <- c("jan", "feb", "mar", "apr", "may", "jun", "jul", "aug",
"sep", "oct", "nov", "dec")
}
names(power_price) <- c("2011", "2012")
答案 0 :(得分:5)
我认为对于像这样的常规(而不是参差不齐)数据集,使用数组会更好 :
period_names <- c("on-peak", "off-peak", "average")
hb_lz_names <- c("HB_BUSAVG", "HB_HOUSTON", "HB_HUBAVG", "HB_NORTH", "HB_SOUTH",
"HB_WEST", "LZ_AEN", "LZ_CPS", "LZ_HOUSTON", "LZ_LCRA", "LZ_NORTH",
"LZ_RAYBN", "LZ_SOUTH", "LZ_WEST")
yrs <- 2011:2012
power.price <- array(1,dim=c(2,12,length(hb_lz_names),length(period_names)))
dimnames(power.price) <- list(year=yrs,month=month.abb,node=hb_lz_names,
period=period_names)
(将名称赋予dimnames
列表中的元素 - 即命名维度 - 可以帮助您记住数组结构...)
然后,您可以使用apply
轻松计算相应边距的平均值(或其他摘要统计信息),并使用ggplot
转换为长格式(用于reshape2::melt
图形或统计分析) ......根据我的经验,深度嵌套的列表是一个痛苦的屁股。