创建虚假数据以重新创建列联表

时间:2018-03-04 02:59:37

标签: r dataframe reshape

是否可以创建虚假数据来重新创建列联表?

例如:

originalTable <- matrix(c(188, 29, 20, 51), ncol = 2, byrow = TRUE)
colnames(originalTable) <- c("A", "B")
rownames(originalTable) <- c("C", "D")

是否可以从表中生成一个数据帧,其中包含288对与表匹配的观察值?

我找到了r2dtable函数,但是有没有想过如何提取或保存为数据帧?

r2dtable(1, c(217, 71), c(208, 80))

提前致谢

2 个答案:

答案 0 :(得分:2)

您只需使用该表生成正确数量的对。

x = c()
for(row in rownames(originalTable)) {
    for(col in colnames(originalTable)) {
        x = rbind(x, matrix(rep(c(row, col), originalTable[row,col]), ncol=2, byrow=TRUE))
    }
}

df = as.data.frame(x)
table(df)
   V2
V1    A   B
  C 188  29
  D  20  51

答案 1 :(得分:1)

您可以使用我的“splitstackshape”软件包中的expandRows

library(splitstackshape)
expandRows(data.frame(as.table(originalTable)), "Freq")
#       Var1 Var2
# 1        C    A
# 1.1      C    A
# 1.2      C    A
# 1.3      C    A
# 1.4      C    A
# -----
# 1.19     C    A
# 1.20     C    A
# 1.21     C    A
# 1.22     C    A
# 1.23     C    A
# 1.24     C    A
# 1.25     C    A
# 1.26     C    A
# 1.27     C    A
# -----
# 4.43     D    B
# 4.44     D    B
# 4.45     D    B
# 4.46     D    B
# 4.47     D    B
# 4.48     D    B
# 4.49     D    B
# 4.50     D    B

nrow(.Last.value)
# [1] 288
sum(originalTable)
# [1] 288

如果您已经在处理实际的as.table,则不需要table

当然,你也可以在没有包的情况下做到这一点:

data.frame(as.table(originalTable))[rep(sequence(prod(dim(originalTable))), 
                                        c(originalTable)), c(1, 2)]