是否可以创建虚假数据来重新创建列联表?
例如:
originalTable <- matrix(c(188, 29, 20, 51), ncol = 2, byrow = TRUE)
colnames(originalTable) <- c("A", "B")
rownames(originalTable) <- c("C", "D")
是否可以从表中生成一个数据帧,其中包含288对与表匹配的观察值?
我找到了r2dtable函数,但是有没有想过如何提取或保存为数据帧?
r2dtable(1, c(217, 71), c(208, 80))
提前致谢
答案 0 :(得分:2)
您只需使用该表生成正确数量的对。
x = c()
for(row in rownames(originalTable)) {
for(col in colnames(originalTable)) {
x = rbind(x, matrix(rep(c(row, col), originalTable[row,col]), ncol=2, byrow=TRUE))
}
}
df = as.data.frame(x)
table(df)
V2
V1 A B
C 188 29
D 20 51
答案 1 :(得分:1)
您可以使用我的“splitstackshape”软件包中的expandRows
:
library(splitstackshape)
expandRows(data.frame(as.table(originalTable)), "Freq")
# Var1 Var2
# 1 C A
# 1.1 C A
# 1.2 C A
# 1.3 C A
# 1.4 C A
# -----
# 1.19 C A
# 1.20 C A
# 1.21 C A
# 1.22 C A
# 1.23 C A
# 1.24 C A
# 1.25 C A
# 1.26 C A
# 1.27 C A
# -----
# 4.43 D B
# 4.44 D B
# 4.45 D B
# 4.46 D B
# 4.47 D B
# 4.48 D B
# 4.49 D B
# 4.50 D B
nrow(.Last.value)
# [1] 288
sum(originalTable)
# [1] 288
如果您已经在处理实际的as.table
,则不需要table
。
当然,你也可以在没有包的情况下做到这一点:
data.frame(as.table(originalTable))[rep(sequence(prod(dim(originalTable))),
c(originalTable)), c(1, 2)]