整洁数据:如何使用重复测量设计组织数据框

时间:2017-10-11 14:33:59

标签: r dataframe data-cleaning

我正在阅读一篇文章" Tidy Data" (https://www.jstatsoft.org/article/view/v059i10)Hadley Wickham讨论了使数据整洁的重要性。我当然同意拥有干净的数据很重要,我的问题在于重复测量设计中的数据组织。

Wickham认为,对于重复测量设计,应该组织数据,如表3,而不是表1.虽然大多数统计测试/算法只能理解表3中的数据输入,但在我们的数据集中,我们还有很多其他变量(例如,职业,性别,年龄,血压等)。对于一些(或大多数)变量,我们只是在基线测量它们,有些不太可能在处理A和B之间改变。我们应该如何组织所有这些数据?我们是否应该将它们作为副本放在"处理"的右侧。和"结果"在这个例子中?或者我们应该只在每次需要运行重复测量分析时创建另一个变量/数据框?

谢谢大家。

enter image description here

enter image description here

0 个答案:

没有答案