通过聚合在数据框中组合矩阵

时间:2013-04-25 05:36:01

标签: r matrix dataframe xtable

我正在尝试按因子计算分位数,并使用xtable将生成的聚合打印为乳胶格式。不幸的是,我得到了一些不稳定的行为。一个干净的解决方案将不胜感激。

创建示例:

tm <- data.frame(f=c("a","b","c"),v=runif(30))
tm$f <- factor(tm$f)
agv <- aggregate(v~f,tm, quantile)

xtable不接受输出agv

xtable(agv)

给出

  

cols [,i + pos]&lt; - do.call(“formatC”,curFormatArgs)出错:     要替换的项目数量不是替换长度的倍数

尽管print(agv)

  f        v.0%       v.25%       v.50%       v.75%      v.100%
1 1 0.002970944 0.253247687 0.571891610 0.766606825 0.986142807
2 2 0.002129951 0.328739086 0.558132094 0.799115979 0.991067470
3 3 0.011059184 0.285322522 0.496035672 0.770908599 0.994420787

因为显然dim(agv)实际上是[1] 3 2

所以我试过了:

cbind(featureName=agv$f, agv$v)

由于某种原因导致字符因子转换为数字值。

经过一些试验和错误,这是我解决的解决方案:

cbind(f=as.character(agv$f), data.frame(agv$v,check.names=F))

,在xtable中给出了我想要的结果:

\begin{table}[ht]
\centering
\begin{tabular}{rlrrrrr}
  \hline
 & f & 0\% & 25\% & 50\% & 75\% & 100\% \\
  \hline
1 & a & 0.00 & 0.25 & 0.48 & 0.75 & 0.99 \\
  2 & b & 0.00 & 0.28 & 0.46 & 0.74 & 1.00 \\
  3 & c & 0.02 & 0.21 & 0.44 & 0.63 & 1.00 \\
   \hline
\end{tabular}
\end{table}

无论如何,我只是好奇是否有更清晰的解决方案,涉及更少的线路。

1 个答案:

答案 0 :(得分:3)

稍微更直接的方法(尽管在概念上与您已经完成的方法没有太大差别)可能是使用do.call(data.frame, ...)。以下适用于我。

xtable(do.call(data.frame, c(agv, check.names = FALSE)))

对我来说,这会回来:

> xtable(do.call(data.frame, c(agv, check.names = FALSE)))
% latex table generated in R 3.0.0 by xtable 1.7-1 package
% Thu Apr 25 11:10:26 2013
\begin{table}[ht]
\centering
\begin{tabular}{rlrrrrr}
  \hline
 & f & v.0\% & v.25\% & v.50\% & v.75\% & v.100\% \\ 
  \hline
1 & a & 0.06 & 0.27 & 0.38 & 0.64 & 0.94 \\ 
  2 & b & 0.20 & 0.38 & 0.52 & 0.70 & 0.87 \\ 
  3 & c & 0.01 & 0.22 & 0.60 & 0.87 & 0.99 \\ 
   \hline
\end{tabular}
\end{table}

xtable也适用于data.table,因此您也可以执行以下操作:

library(data.table)

DT <- data.table(tm, key = "f")
xtable(DT[, as.list(quantile(v)), by = key(DT)])

在这里,DT[, as.list(quantile(v)), by = key(DT)]将为您提供与“agv”对象相同的结果。