为Yeo和Johnson变换估计Lambda

时间:2016-11-07 01:08:48

标签: r csv lambda transformation r-car

我在csv文件中有一系列降雨量值。我绘制了数据的直方图。直方图向左倾斜。我想转换这些值,使其具有正态分布。我使用R中可用的Yeo-Johnson变换。变换后的值为here

我的问题是:

在上面的转换中,我对lambda使用了0.5的测试值,工作正常。是否可以根据时间序列确定lambda的最佳值?我会感激任何建议。

到目前为止,这里是代码:

library(car)
dat <- scan("Zamboanga.csv")
hist(dat)
trans <- yjPower(dat,0.5,jacobian.adjusted=TRUE)
hist(trans)

Here is the csv file

1 个答案:

答案 0 :(得分:2)

首先使用汽车包中的函数boxCox找出最佳lambda,以最大似然估计λ。

您可以这样绘制:

boxCox(your_model, family="yjPower", plotit = TRUE)

example from CV

正如Ben Bolker在评论中所说,这里的模型可能类似于

your_model <- lm(dat~1)

然后在现有代码中使用优化的lambda。