采用不平衡观测的长格式数据处理

时间:2015-11-27 08:07:14

标签: r dataset mixed-models

我正在组织使用混合模型的数据。

关于nr观察,数据不平衡。

它看起来像这样:

Id <- c("A","A","A","A", "B", "B", "B", "C", "C", "D","D","D","D","D","D")
v1 <- c(5,5,5,5,8,8,8,15,15,4,4,4,4,4,4)
v2 <- c(3,3,3,3,5,5,5,10,10,8,8,8,8,8,8)

my_data <- data.frame(Id, v1, v2)

head(my_data, n = 20)

v1和v2可以看作是静态预测变量,因为它们与ID具有相同的值。数据在观测数量方面不平衡。

问题A =如何计算静态预测变量v1的平均值(每个ID的v1观察值的平均值)。

问题B =我如何使用&#34; cut number&#34;将v1组织成一个新的静态预测器,在数据集的新列中有3个级别(&#34;低&#34;,&#34;中位数&#34;,&#34;高&#34;)?

1 个答案:

答案 0 :(得分:0)

问题A:

mean(tapply(v1, Id, mean))

问题B:使用cut()功能。