使用小数据集进行CCA分析

时间:2018-01-30 06:11:49

标签: r vegan

我正在使用R和纯素包来分析不同地点的环境因素对细菌群落(OTU表)的重要性。但是我遇到了一些我不确定如何解决的问题,以及我的方法是否合适。得到一些反馈会很棒。

1)我有一张桌子,有15个站点,380种,每个站点有一个8个环境因子表。这对cca来说太小了吗?有关更好方法的任何建议吗?

2)我使用了cca(),这给了我非常相似的约束/无约束的特征值 - 我认为受约束的特征值需要较低才能成为一个合适的分析 - 可能是小数据集的问题? / p>

3)我的一些环境因素是相关的,我检查了他们的VIF,我的值在1到61之间。显然<10是可以接受的 - 最好去除高价值因素?

希望这有意义,非常感谢,提前谢谢!

干杯 梅尔

1 个答案:

答案 0 :(得分:0)

  1. 15次观察对于重要性测试并不多。
  2. 如果特征值在约束和非约束分析中非常相似,则可能有太多约束。这可以追溯到小数据集和大量约束变量。
  3. 不一定:高VIF意味着变量的 set 是自相关的,但它可能不是选择具有最高VIF的那个的最佳选择:在减少集合后,删除变量可能有低VIF,完全没问题。您应该构建一个小模型(不是很多变量),然后检查它是否也适用于VIF。