如果您有2个交叉分类变量,则可以使用rowSums
和colSums
在xtabs
输出上生成保证金总计。但是,如果你有3个分类变量(即每个子表中的边际总数),怎么办呢?
答案 0 :(得分:7)
Aniko在评论中提到了这一点,但它从来没有作为答案提供。
我是独立发现的,然后注意到它在评论中,所以归功于Aniko获得它。
addmargins
就是答案:
对于给定的表,可以指定哪个分类因子 扩展一个或多个级别以保持要计算的边距。有人可能 例如,在第一维和中位数上形成总和和均值 在第二个。结果表将有两个额外的级别 第一个维度和第二个维度的一个额外级别。该 default是对表中的所有边距求和。其他可能性 可能会给出取决于边距顺序的结果 计算。这是在函数的打印输出中标记的。
答案 1 :(得分:4)
一般方法是使用apply
函数,但专门针对总计margin.table
函数可能更方便:
#create 3 factors
a <- gl(2,4, length=20)
b <- gl(3,2, length=20)
d <- gl(4,2, length=20)
# table
tt <- xtabs(~a+b+d)
# marginal sums
margin.table(tt, 1)
apply(tt, 1, sum) #same answer
#multi-way margins
margin.table(tt, 1:2)
apply(tt, 1:2, sum) #same answer
答案 2 :(得分:4)
如果你没有绑定到xtabs,那么Deducer包对列联表有一些很好的功能:
> a <- gl(2,4, length=20)
> b <- gl(3,2, length=20)
> d <- rnorm(20)>0
> dat <- data.frame(a,b,d)
> tables<-contingency.tables(
+ row.vars=a,
+ col.vars=b,
+ stratum.var=d,data=dat)
> tables
================================================================================
==================================================
========== Table: a by b ==========
| -- Stratum = FALSE --
| b
a | 1 | 2 | 3 | Row Total |
-----------------------|-----------|-----------|-----------|-----------|
1 Count | 2 | 2 | 1 | 5 |
Row % | 40.000% | 40.000% | 20.000% | 55.556% |
Column % | 40.000% | 100.000% | 50.000% | |
Total % | 22.222% | 22.222% | 11.111% | |
-----------------------|-----------|-----------|-----------|-----------|
2 Count | 3 | 0 | 1 | 4 |
Row % | 75.000% | 0.000% | 25.000% | 44.444% |
Column % | 60.000% | 0.000% | 50.000% | |
Total % | 33.333% | 0.000% | 11.111% | |
-----------------------|-----------|-----------|-----------|-----------|
Column Total | 5 | 2 | 2 | 9 |
Column % | 55.556% | 22.222% | 22.222% | |
| -- Stratum = TRUE --
| b
a | 1 | 2 | 3 | Row Total |
-----------------------|-----------|-----------|-----------|-----------|
1 Count | 2 | 2 | 3 | 7 |
Row % | 28.571% | 28.571% | 42.857% | 63.636% |
Column % | 66.667% | 50.000% | 75.000% | |
Total % | 18.182% | 18.182% | 27.273% | |
-----------------------|-----------|-----------|-----------|-----------|
2 Count | 1 | 2 | 1 | 4 |
Row % | 25.000% | 50.000% | 25.000% | 36.364% |
Column % | 33.333% | 50.000% | 25.000% | |
Total % | 9.091% | 18.182% | 9.091% | |
-----------------------|-----------|-----------|-----------|-----------|
Column Total | 3 | 4 | 4 | 11 |
Column % | 27.273% | 36.364% | 36.364% | |
================================================================================
答案 3 :(得分:2)
(如果我理解正确的话)你可以使用ddply:
ff <- data.frame(f1=c("a", "b", "b", "b", "b", "b", "b"), f2=c("p", "p", "p", "q", "q", "q", "q"), f3=c("x","x","x","x","y", "y", "y"), val=c(1:7))
ddply(ff, .(f1), numcolwise(sum))
ddply(ff, .(f2), numcolwise(sum))
ddply(ff, .(f3), numcolwise(sum))
答案 4 :(得分:0)
评论不起作用。感谢您的回答,但他们并没有按照我的预期行事 - 每个分组中的个人总数。
经过一番挖掘,我发现在这种情况下xtabs输出是一个三维数组,并编写了以下函数来实现我想要的结果(注意它不完整,但到目前为止适用于列总数):
xtabTotals <- function(tabs,margin=1)
# takes a 3 dimensional xtabs array and performs margin total on each sub table
# only doing column margins so far
{
out <- array(0,dim(tabs)+c(1,0,0))
dnout <- dimnames(tabs)
dnout[[1]] <- c(dnout[[1]],"Total")
dimnames(out) <- dnout
for (i in 1:dim(tabs)[3])
{
out[,,i] <- rbind(tabs[,,i],colSums(tabs[,,i]))
}
out
}