我一直在尝试查找R中ordered
和无序factor
变量之间的差异。特别是?factor
文档中的这一行令我感到困惑:
Ordered factors differ from factors only in their class, but methods and
the model-fitting functions treat the two classes quite differently.
我最接近找到答案的答案来自这三个问题的答案:
在回答上述第一个问题时, @joran 已经说过"统计差异的详细摘要可能超出了StackOverflow答案的范围。&# 34;
我不是在这里寻找详细的摘要,但是任何人都可以举一个小而简单的例子来说明ordered
和无序factor
在方法和模型拟合函数中的使用方式有何不同?
答案 0 :(得分:3)
有序因子默认使用正交多项式对比。那片土地 Q代表线性和二次项。使用无序因素 “治疗”虽然对比鲜明(但实际上并不存在对比)。
了解阅读: http://r.789695.n4.nabble.com/Models-with-ordered-and-unordered-factors-td4072225.html http://www.stat.berkeley.edu/~s133/factors.html
答案 1 :(得分:2)
最容易看出的主要差异是“漂亮的印刷。”#34;在控制台中,有序因子打印得很好,它们确定了ggplots中标签的顺序。
就建模而言,在拟合线性模型中为它们生成的对比是不同的。如果您正在寻找描述材料的一些简单示例,我建议您查看http://www.ats.ucla.edu/stat/r/library/contrast_coding.htm。本文中的两点给出了两种方案的示例: 1.虚拟编码 - 无序R因子 4.正交多项式编码 - 有序R因子。
总而言之,虚拟编码使用简单的水平与拟合模型中的参考水平比较(例如性别,种族等);而多项式编码使用趋势分析(对于收入或教育等变量)。
以上链接中的示例位于R中,因此可以很好地说明您的查询。