在R中执行4循环(?)anova

时间:2014-02-04 09:59:03

标签: r loops analysis anova spectral

我正在对植被进行光谱分析,并且正在研究哪个是最重要的波长,以便进行一些遥感。

然而,我有2000个波长,所以我需要找到一种快速运行ANOVA的方法,我已经阅读了关于4循环(或只是循环),这意味着我可以更快地进行,而不必单独进行每一次。

目前我的R代码是:

mod_structure1 <- lm(X350 ~ structure, data=mydata)   
mod_structure1
summary(mod_structure1)
boxplot(X350 ~ structure, data=mydata, xlab="blah", ylab="350nm")
anova(mod_structure1)

X350的波长为350nm。

我真的很感激一些帮助 - 我的R知识不是很好,如果这不是真的有道理,那么道歉。

1 个答案:

答案 0 :(得分:0)

lapply比for循环更快并且做同样的伎俩:

首先定义一个包含波长名称的矢量。这样做很难,因为您没有包含示例数据。

wavs <- c("X350", "X...", "X...",...)

由于您有这么多波长,您可能不希望手动执行此操作。包括您的数据示例,因此建议更容易,但是说您将它们作为数据框的列(从X350猜测):

require(reshape2)
wavdata <- melt(mydata, id = "structure")
wavs <- levels(wavdata$variable)

然后你可以继续循环:

mods <- lapply(wavs, function(i) {
x <- subset(wavdata, variable == wavs)
mod_structure1 <- lm(variable ~ value, data=x)
anova(mod_structure1)})

这为您提供了令人难以置信的ANOVA列表,因此请做好准备。从这些ANOVA到data.frame获取相关参数可能会更好,这样更容易处理。

mod.data <- lapply(wavs, function(i) {
x <- subset(wavdata, variable == wavs)
mod_structure1 <- lm(variable ~ value, data=x)
tmp <- anova(mod_structure1)
data.frame(Df = tmp$Df[[1]], F = tmp$F[[1]], p = tmp$P[[1]])
})

do.call(rbind, mod.data)

代码未经过测试,可能包含错误。但是,您可以根据其背后的想法生成自己的想法。