美好的一天,
我想根据每天半小时测量的风速(每天48风速,有时缺少几小时)来创建威布尔分布。
然后根据威布尔分布,我想根据每日威布尔分布计算某个目标风速的密度(在这个数据集中,29km / hr)。
为此,我需要每天安排13年的数据集来计算威布尔分布的两个参数(scale = a和shape = b),以估算每天目标点的密度。由于这是一个大型数据集,我需要使用某个功能来自动处理它并将日常结果放在不同的表格中(a,b,密度为29 km / hr)(可能是'返回'功能??)
我的数据如下:
Time windspeed direction Date day_index
1 24/07/2000 13:00 31 310 2000-07-24 13:00:00 2000_206
2 24/07/2000 13:30 41 320 2000-07-24 13:30:00 2000_206
3 24/07/2000 14:30 37 290 2000-07-24 14:30:00 2000_206
4 24/07/2000 15:00 30 300 2000-07-24 15:00:00 2000_206
5 24/07/2000 15:30 24 320 2000-07-24 15:30:00 2000_206
6 24/07/2000 16:00 22 330 2000-07-24 16:00:00 2000_206
7 24/07/2000 16:30 37 270 2000-07-24 16:30:00 2000_206
这是此链接网页(How can I apply "sapply" in R with multiple codes in one function?)
的进一步问题之前的评论表明我可能需要使用'aggregate'或'ddply'函数。为了分析意图,我如何在函数中加入多个参数?
我的多个参数的函数是:
library(bReeze)
library(xts)
time_ballarat <- strptime(ballarat_alldata[,1], "%d/%m/%Y %H:%M")
multiple.function <- set1 <- createSet(height=10, v.avg=ballarat_alldata[,2], dir.avg=ballarat_alldata[,3]) + ballarat <- createMast(time.stamp=time_ballarat, set1) + ballarat <- clean(mast=ballarat) + ballarat.wb <- weibull(mast=ballarat, v.set=1, print=FALSE) + my.x <- density(ballarat_alldata$windspeed, from = 0, to = max(ballarat_alldata$windspeed))$x + my.y <- density(ballarat_alldata$windspeed, from = 0, to = max(ballarat_alldata$windspeed))$y + df <- data.frame(x = my.x, y = my.y) + my.nls <- nls(y ~ (a/b) * (x/b)^(a-1) * exp(- (x/b)^a), + data = df[df$x > 0, ], + start = c(a = ballarat.wb[13,2], b = ballarat.wb[13,1])) + xValues <- seq(from = 0, to = 40, length.out = 100) + my.predicted <- predict(my.nls, data.frame(x = xValues)) + my.coef <- coef(my.nls) + my.weibull.predict <- function(x, a, b) { + y <- (a/b) * (x/b)^(a-1) * exp(- (x/b)^a) + return(y)} + return(c(ballarat.parameter = my.coef[1], ballarat.scale= my.coef[2], + my29 = my.weibull.predict(29, my.coef[1], my.coef[2])))}
我不确定这可以计算出每天目标速度的密度。你能否检查一下它是否符合我的意图? “multiple.function”的主要问题是weibull分布代码应该根据每天的不同数据而不同地创建。代码中缺少这个。
例如,在"createSet(height=10, v.avg=ballarat_alldata[,2], dir.avg=ballarat_alldata[,3])"
中,v.avg
和dir.avg
不应包含计算的所有数据集,但我不知道如何。
我还是R的初学者,所以我提前就我的问题道歉。问题可能太具体了..请帮我找到解决问题的方法!
此致
抗敏。