我有一个带有分类变量和连续因变量的数据集,我想知道每个类别的平均值偏离整体均值的影响。
str(dat)
'data.frame': 380 obs. of 2 variables:
$ Pgene_3X : num 0 0 0.08 0 0.048 ...
$ CT : Factor w/ 22 levels "1:ATG1","10:ATC3",..: 15 15 21 21 21 21 21 21 21 15 ...
由于分类变量中的组不平衡,我想在R中使用加权效应编码。
我尝试过这个包" wec"。
dat$CTatg1 <- contr.wec("dat$CT",ref="1:ATG1")
但它给了我一个错误:
控制处理错误(n.cat,base = ref):没有足够的自由度来定义对比
此功能适用于R提供的虚拟BMI数据,但不适用于我的数据。 有没有其他方法来解决这个问题。如何比较每个&#34; CT&#34;的平均值?水平与总加权平均值?