我的输入文件以样本ID作为行名称进行组织,每列代表一个特定的操作分类单元,数据是该OTU的绝对丰度数。我设置了具有二进制虚拟变量的csv文件,以指示样本是3个位置(L1,L2,L3)之一和6个描述类别(D1,D2,D3,D4,D5,D6)之一。每个样本对于三个L类别中的一个和6个D类别中的一个具有1,并且对于它们不属于的其他7个类别具有零。虚拟变量位于数据表的前9列中。当我用这个公式运行CCA时:
L6DummyVariables.cca <- cca(L6DummyVariables[ ,10:100] ~ L1+L2+L3+D1+D2+ D3+D4+D5+D6,
data=L6DummyVariables)
并绘制它,L3和D6没有矢量箭头。我需要在配方中改变一些东西吗?有人告诉我,他们不在,因为其他载体与失踪的载体有关,但这似乎对我没有意义。我看过的其他教程似乎显示了所有变量我的排序经验非常有限,所以如果我遗漏了一些基本的东西我会道歉。谢谢! My CCA Plot
答案 0 :(得分:0)
L1,L2和L3向量与(截距)项共线,因此其中一个(在这种情况下为L3)被丢弃。同样,对于您的一个描述性变量。这听起来像你的回归或线性代数经验是因果关系&#34;限制&#34;在这里,而不是&#34; ordination经验不足&#34;。我们无法评论&#34;其他&#34;未开发的教程。关于术语的说明:&#34;环境变量&#34;是一个术语,用于描述确定R和相关包的操作的系统级变量,因此如果您指的是您的协变量,那么将该短语与R程序员一起使用可能会引起混淆。
您可能也在浪费努力创建虚拟变量。 R因子能够编码不同的组成员资格,R回归函数将自动生成&#34; dummies&#34;在model.matrix构建时。