我想从数据帧的str输出中提取一些信息。
试过这个......
> tmp <- str(iris)
> tmp
NULL
是否可以将其存储在变量中?
答案 0 :(得分:40)
您可以使用capture.output
:
l = capture.output(str(mtcars))
l
[1] "'data.frame':\t32 obs. of 11 variables:"
[2] " $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ..."
[3] " $ cyl : num 6 6 4 6 8 6 8 4 4 6 ..."
[4] " $ disp: num 160 160 108 258 360 ..."
[5] " $ hp : num 110 110 93 110 175 105 245 62 95 123 ..."
[6] " $ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ..."
[7] " $ wt : num 2.62 2.88 2.32 3.21 3.44 ..."
[8] " $ qsec: num 16.5 17 18.6 19.4 17 ..."
[9] " $ vs : num 0 0 1 1 0 1 0 1 1 1 ..."
[10] " $ am : num 1 1 1 0 0 0 0 0 0 0 ..."
[11] " $ gear: num 4 4 4 3 3 3 3 4 4 4 ..."
[12] " $ carb: num 4 4 1 1 2 1 4 2 2 4 ..."
答案 1 :(得分:1)
稍微以thelatemail的方法为基础,似乎summary.default
会为每列提供3位信息...因此我们可以使用快速传播来获得更简洁的输出:
iris %>% summary.default %>% as.data.frame %>%
dplyr::group_by(Var1) %>% tidyr::spread(key = Var2, value = Freq)
# A tibble: 5 x 4
# Groups: Var1 [5]
Var1 Length Class Mode
<fct> <fct> <fct> <fct>
1 Sepal.Length 150 -none- numeric
2 Sepal.Width 150 -none- numeric
3 Petal.Length 150 -none- numeric
4 Petal.Width 150 -none- numeric
5 Species 150 factor numeric
不确定是什么模式,但至少它是整齐的。