我正在组织使用混合模型的数据。
关于nr观察,数据不平衡。
它看起来像这样:
Id <- c("A","A","A","A", "B", "B", "B", "C", "C", "D","D","D","D","D","D")
v1 <- c(5,5,5,5,8,8,8,15,15,4,4,4,4,4,4)
v2 <- c(3,3,3,3,5,5,5,10,10,8,8,8,8,8,8)
my_data <- data.frame(Id, v1, v2)
head(my_data, n = 20)
v1和v2可以看作是静态预测变量,因为它们与ID具有相同的值。数据在观测数量方面不平衡。
问题A =如何计算静态预测变量v1的平均值(每个ID的v1观察值的平均值)。
问题B =我如何使用&#34; cut number&#34;将v1组织成一个新的静态预测器,在数据集的新列中有3个级别(&#34;低&#34;,&#34;中位数&#34;,&#34;高&#34;)?
答案 0 :(得分:0)
问题A:
mean(tapply(v1, Id, mean))
问题B:使用cut()
功能。