打印因子摘要"转置"办法

时间:2014-04-19 17:11:48

标签: r printing transpose summary r-factor

我有一个因子变量,我想检索每个级别的计数。使用summary()函数很容易:

> h <- rnorm(100, 170, 10)
> hf <- cut(h, breaks=10)
> summary(hf)
(142,147] (147,153] (153,158] (158,163] (163,169] (169,174] (174,180] (180,185] (185,190] 
        5         3         7        20        11        23        12        11         6 
(190,196] 
        2

但是我希望将它包含在knitr报告中,所以我更喜欢以人性化的方式显示数据。最明显的方法是转置它,所以我得到这样的东西:

(142,147]           5
(147,153]           3
(153,158]           7
(158,163]          20
(163,169]          11
(169,174]          23
(174,180]          12
(180,185]          11
(185,190]           6
(190,196]           2

问题是:实现这一目标的最佳方式是什么?
(并且通过&#34;最好的&#34;我的意思是&#34;干净,高效,紧凑,没有任何副作用&#34;)

下面我概述一些我尝试过的方法,以及为什么我对这些

中的任何一个都不满意

as.data.frame

> r <- as.data.frame(summary(hf))
> colnames(r) <- ""
> r

(142,147]  5
(147,153]  3
(153,158]  7
(158,163] 20
(163,169] 11
(169,174] 23
(174,180] 12
(180,185] 11
(185,190]  6
(190,196]  2

我不喜欢这样的事实:我使用临时变量存储数据框和一行代码只是为了压制第二列标题(默认情况下读取summary(hf),并且不是很有帮助)。如果我可以在将摘要转换为data.frame时隐藏列名,或者使用一些打印函数/参数,那将是完美的。

> as.data.frame(table(hf))
          hf Freq
1  (142,147]    5
2  (147,153]    3
3  (153,158]    7
4  (158,163]   20
5  (163,169]   11
6  (169,174]   23
7  (174,180]   12
8  (180,185]   11
9  (185,190]    6
10 (190,196]    2

这里的标题更具可读性,但现在我有了不需要的行名。这引出了我的下一个解决方案。

write.table

> write.table(as.data.frame(table(hf)), col.names=FALSE, row.names=FALSE)
"(142,147]" 5
"(147,153]" 3
"(153,158]" 7
"(158,163]" 20
"(163,169]" 11
"(169,174]" 23
"(174,180]" 12
"(180,185]" 11
"(185,190]" 6
"(190,196]" 2

只要因子级别名称具有相同的长度,这就没问题。当它们有不同的长度时,事情开始变得不对齐:

> write.table(as.data.frame(table(h>170)), col.names=FALSE, row.names=FALSE)
"FALSE" 51
"TRUE" 49

如果有人读到目前为止,请允许我重复我的问题:
获得&#34;转置&#34;中显示的每个因子水平的出现次数的最佳方法是什么?表,可能没有任何副作用?

1 个答案:

答案 0 :(得分:1)

看起来你只是想要这个:

setNames(as.data.frame(summary(hf)), "")

当然你也可以将你的代码包装在一个函数中......