R中的dbRDA,如何处理环境数据的丰度数据和缺失值

时间:2018-08-06 20:35:32

标签: r vegan rda

使用R,我试图在10个采样日内对一组9种物种(单位细胞/ mL)的丰度数据进行dbRDA,我有8个环境变量(不同的单位和一些缺失的值)。我想要进行一次测试,以显示环境变量如何影响这些天中丰度之间的变化。

问:dbRDA是正确的测试吗?还是CCA?

问:我怎么知道我是否应该sqrt.dist = TRUE?

问:使用dbrda,cca和capscale有什么区别?

dismat <- vegdist(Abundance_data, method="bray", binary=FALSE, diag=FALSE, 
upper=FALSE, na.rm = FALSE)

vare.cap <- dbrda(dismat~ T + F + S + Chl + Ice + AirT + WD + WS, data=df, 
dist = "bray", scale = TRUE, sqrt.dist = TRUE, na.action = na.omit)

anova(vare.cap)
anova(vare.cap, by="margin")
anova(vare.cap, by="terms")

问:保证金和条款有什么区别?

1 个答案:

答案 0 :(得分:0)

问题不是技术性很强,因此回答您可能是错误的。但是,这里回答了四个问题的当前状态:

问: dbRDA或CCA:不能不加怀疑地简短回答。确实没有答案:有些人喜欢dbRDA,有些人则喜欢CCA。它与指标有关(=当您说两个采样单位互不相同时,您的意思是什么)以及如何进行度量。这是科学流派和传统的问题,您确实应该咨询您的同事和主管,以了解环境中的工作方式。解释这些差异所需要的空间比本论坛中的空间要大得多。顺便说一句,尽管dbRDA或CCA都不是测试,但是分析后可以将它们与置换测试一起使用。

问:是否使用sqrt.dist:同样,这是科学学校的问题。 sqrt.dist试图解决的问题是,基于距离的方法可以给出带有流行的生态差异指数的微小负特征值,并且在许多情况下,可以通过采用差异的平方根来使用它们。这些负面的特征值让我不用担心,我也不用使用sqrt.dist,但是许多人对此感到非常恐惧。使用sqrt.dist的问题在于,您不再分析指定的差异,而是分析其平方根。负特征值的影响通常只会出现在您不感兴趣的后一个轴上,而前两个轴是不敏感的(例如,使用参数add不会对它们产生太大影响),如果在这种情况下,sqrt.dist = TRUE是没有用的。但是,您应该再次检查当地传统(询问您的朋友和主管)并进行相应的工作。

问: dbRDA,CCA或capscale。对于CCA,请参阅第一个答案。对于capscale:不要使用它,而要使用dbrda,它可以实现(我认为)更好的方法。但是,dbrdacapscale的区别仅在于它们对负特征值的处理方式不同,并且如果没有负特征值,它们的结果相同,您可以使用其中任何一个。

问:保证金与条款:这是指测试单个约束变量(或条款)。当测试术语时,变量将按照模型定义中的顺序或顺序进行测试:(1)仅第一个变量的作用,(2)具有第一个变量后的第二个变量的作用,(n)变量的作用具有n-1个变量后的第n个变量。 “边距”是指模型中具有所有n-1个其他变量后,每个变量的边际效应或唯一效应。这与其他标准 R 函数(例如,线性模型lm的ANOVA中的定义)相同。顺序测试是合理的,而边际测试则更容易理解。有时边际测试会更有用,但可能会产生误导。策略之间的差异取决于您的解释变量的相互依赖性(共线性),并且如果您的变量是独立的(不相关),差异就会消失。