我正在尝试按因子计算分位数,并使用xtable将生成的聚合打印为乳胶格式。不幸的是,我得到了一些不稳定的行为。一个干净的解决方案将不胜感激。
创建示例:
tm <- data.frame(f=c("a","b","c"),v=runif(30))
tm$f <- factor(tm$f)
agv <- aggregate(v~f,tm, quantile)
xtable不接受输出agv
:
xtable(agv)
给出
cols [,i + pos]&lt; - do.call(“formatC”,curFormatArgs)出错: 要替换的项目数量不是替换长度的倍数
尽管print(agv)
是
f v.0% v.25% v.50% v.75% v.100%
1 1 0.002970944 0.253247687 0.571891610 0.766606825 0.986142807
2 2 0.002129951 0.328739086 0.558132094 0.799115979 0.991067470
3 3 0.011059184 0.285322522 0.496035672 0.770908599 0.994420787
因为显然dim(agv)
实际上是[1] 3 2
所以我试过了:
cbind(featureName=agv$f, agv$v)
由于某种原因导致字符因子转换为数字值。
经过一些试验和错误,这是我解决的解决方案:
cbind(f=as.character(agv$f), data.frame(agv$v,check.names=F))
,在xtable
中给出了我想要的结果:
\begin{table}[ht]
\centering
\begin{tabular}{rlrrrrr}
\hline
& f & 0\% & 25\% & 50\% & 75\% & 100\% \\
\hline
1 & a & 0.00 & 0.25 & 0.48 & 0.75 & 0.99 \\
2 & b & 0.00 & 0.28 & 0.46 & 0.74 & 1.00 \\
3 & c & 0.02 & 0.21 & 0.44 & 0.63 & 1.00 \\
\hline
\end{tabular}
\end{table}
无论如何,我只是好奇是否有更清晰的解决方案,涉及更少的线路。
答案 0 :(得分:3)
稍微更直接的方法(尽管在概念上与您已经完成的方法没有太大差别)可能是使用do.call(data.frame, ...)
。以下适用于我。
xtable(do.call(data.frame, c(agv, check.names = FALSE)))
对我来说,这会回来:
> xtable(do.call(data.frame, c(agv, check.names = FALSE)))
% latex table generated in R 3.0.0 by xtable 1.7-1 package
% Thu Apr 25 11:10:26 2013
\begin{table}[ht]
\centering
\begin{tabular}{rlrrrrr}
\hline
& f & v.0\% & v.25\% & v.50\% & v.75\% & v.100\% \\
\hline
1 & a & 0.06 & 0.27 & 0.38 & 0.64 & 0.94 \\
2 & b & 0.20 & 0.38 & 0.52 & 0.70 & 0.87 \\
3 & c & 0.01 & 0.22 & 0.60 & 0.87 & 0.99 \\
\hline
\end{tabular}
\end{table}
xtable
也适用于data.table
,因此您也可以执行以下操作:
library(data.table)
DT <- data.table(tm, key = "f")
xtable(DT[, as.list(quantile(v)), by = key(DT)])
在这里,DT[, as.list(quantile(v)), by = key(DT)]
将为您提供与“agv”对象相同的结果。