我有一个原始的多维列联表,我想将其转换为整洁的数据或其他长格式,以便可以在其上进行逻辑回归。我发现其中的部分内容很棒methods。但是我想要一种迭代处理整件事的策略。
其中一半已格式化:
red
这是完整的原始数据,已删除其标题:
White
<35 35-44 >44
Region M F M F M F
Northeast
Satisfied 288 60 224 35 337 70
Not satisfied 177 57 166 19 172 30
Mid-Atlantic
Satisfied 90 19 96 12 124 17
Not satisfied 45 12 42 5 39 2
Southern
Satisfied 226 88 189 44 156 70
Not satisfied 128 57 117 34 73 25
这是我照顾一个部分的方法:
> dput(df_raw)
structure(list(V1 = c(288L, 177L, 90L, 45L, 226L, 128L), V2 = c(60L,
57L, 19L, 12L, 88L, 57L), V3 = c(224L, 166L, 96L, 42L, 189L,
117L), V4 = c(35L, 19L, 12L, 5L, 44L, 34L), V5 = c(337L, 172L,
124L, 39L, 156L, 73L), V6 = c(70L, 30L, 17L, 2L, 70L, 25L), V7 = c(38L,
33L, 18L, 6L, 45L, 31L), V8 = c(19L, 35L, 13L, 7L, 47L, 35L),
V9 = c(32L, 11L, 7L, 2L, 18L, 3L), V10 = c(22L, 20L, 0L,
3L, 13L, 7L), V11 = c(21L, 8L, 9L, 2L, 11L, 2L), V12 = c(15L,
10L, 1L, 1L, 9L, 2L)), class = "data.frame", row.names = c(NA,
-6L))
但是,我对如何将其应用于几类分类变量感到困惑。