R中的加权效应编码

时间:2016-05-23 14:47:52

标签: r statistics regression linear-regression anova

我有一个带有分类变量和连续因变量的数据集,我想知道每个类别的平均值偏离整体均值的影响。

str(dat)
'data.frame':   380 obs. of  2 variables:
$ Pgene_3X     : num  0 0 0.08 0 0.048 ...
$ CT           : Factor w/ 22 levels "1:ATG1","10:ATC3",..: 15 15 21 21 21 21 21 21 21 15 ...

由于分类变量中的组不平衡,我想在R中使用加权效应编码。

我尝试过这个包" wec"。

dat$CTatg1 <- contr.wec("dat$CT",ref="1:ATG1")

但它给了我一个错误:

  

控制处理错误(n.cat,base = ref):没有足够的自由度来定义对比

此功能适用于R提供的虚拟BMI数据,但不适用于我的数据。 有没有其他方法来解决这个问题。如何比较每个&#34; CT&#34;的平均值?水平与总加权平均值?

1 个答案:

答案 0 :(得分:0)

我刚刚查看了"wec" package的手册。 我怀疑您可能需要用“省略”替换参数“ ref”。