如何在R中使用多个代码在一个函数中应用“sapply”?

时间:2013-12-09 08:47:48

标签: r matrix weibull

我是新的R用户。我有一个简单的sapply函数示例,用于计算拆分数据框的meansd。我的数据包含半小时风速和方向。我想知道我的研究每日Weibull分发13年。这就是我的数据集根据时间分割的原因。

我的数据如下:

    Time             windspeed direction    Date            day_index
1   24/07/2000 13:00    31       310    2000-07-24 13:00:00 2000_206
2   24/07/2000 13:30    41       320    2000-07-24 13:30:00 2000_206
3   24/07/2000 14:30    37       290    2000-07-24 14:30:00 2000_206
4   24/07/2000 15:00    30       300    2000-07-24 15:00:00 2000_206
5   24/07/2000 15:30    24       320    2000-07-24 15:30:00 2000_206
6   24/07/2000 16:00    22       330    2000-07-24 16:00:00 2000_206
7   24/07/2000 16:30    37       270    2000-07-24 16:30:00 2000_206  

我使用split-apply查看日期的示例R代码是:

my.summary <- sapply(split(ballarat_alldata[1:200, ],
                           ballarat_alldata$day_index[1:200]),
                     function(x) {
                         return(c(my.mean=mean(x$windspeed),
                                  my.sd=sd(x$windspeed)))
                     })

用于计算形状和比例参数的Weibull分布代码为:

set1 <- createSet(height=10,
                  v.avg=ballarat_alldata[,2],
                  dir.avg=ballarat_alldata[,3])
time_ballarat <- strptime(ballarat_alldata[,1], "%d/%m/%Y %H:%M")
ballarat <- createMast(time.stamp=time_ballarat, set1)
ballarat <- clean(mast=ballarat)
ballarat.wb <- weibull(mast=ballarat, v.set=1, print=FALSE)

如何组合这两组R代码来每天计算Weibull参数并存储在矩阵中?

我尝试了很多方法,但效果不好 如果组合了这两组R代码,我是否应该更改set1 <- createSet(height=10, v.avg=ballarat_alldata[,2], dir.avg=ballarat_alldata[,3])中的风速和方向范围?

1 个答案:

答案 0 :(得分:1)

这里似乎有两个不同的问题:1)聚合数据2)计算Weibull参数。对于第一个问题,我可以推荐类似的东西:

library(plyr)
Wind <- ddply(Wind, .(as.Date(Date)), transform, 
Wind.mean = mean(windspeed), Wind.sd = sd(windspeed))
#       windspeed direction      Date2    Time2 day_index Wind.mean  Wind.sd
#       1        31       310 2000-07-24 13:00:00  2000_206  36.33333 5.033223
#       2        41       320 2000-07-24 13:30:00  2000_206  36.33333 5.033223
#       3        37       290 2000-07-24 14:30:00  2000_206  36.33333 5.033223
#       4        30       300 2000-07-25 15:00:00  2000_206  28.25000 6.751543
#       5        24       320 2000-07-25 15:30:00  2000_206  28.25000 6.751543
#       6        22       330 2000-07-25 16:00:00  2000_206  28.25000 6.751543
#       7        37       270 2000-07-25 16:30:00  2000_206  28.25000 6.751543

如果您再给我一些关于如何计算参数的提示,您还可以使用summarise库中的plyr,例如

ddply(Wind, .(Date2), summarise, rweibull(# I'm not sure what goes here

希望这有帮助。