在R编程中,在数据集

时间:2017-10-22 20:35:24

标签: r dataset analysis

我在名为birthwt的数据集上执行 R 编程问题。首先,为了安装和加载数据集。输入以下命令

library(MASS)
birthwt

输出显示如下:

birthwt

数据集是关于"与低婴儿出生体重相关的风险因素"。

我使用table()功能(或其他方法)来了解研究中有多少女性1)白人,2)谁吸烟,3)有婴儿被认为是低出生体重。 (这意味着所有三个属性/特征在一起。)

这是我的代码:

birthwt3 <- data.frame(birthwt$race, birthwt$smoke,birthwt$low)
table(birthwt3)

这是输出:

table form

但是查看输出后,多维表变得更难以理解,我无法找到该问题的答案。

任何人都可以帮我解决这个问题以及我可以使用哪些其他有用的功能来查看难以理解的多维表格吗?

1 个答案:

答案 0 :(得分:1)

我绝对会使用group_by包提供的summarisedplyr功能。试试这个:

birthwt <- MASS::birthwt
### install dplyr if you haven't already
#install.packages("dplyr")
library(dplyr)

birthwt %>% 
    group_by(race, smoke, low) %>% 
    summarise(n = n())

你应该得到这个:

# A tibble: 12 x 4
# Groups:   race, smoke [?]
    race smoke   low     n
   <int> <int> <int> <int>
 1     1     0     0    40
 2     1     0     1     4
 3     1     1     0    33
 4     1     1     1    19
 5     2     0     0    11
 6     2     0     1     5
 7     2     1     0     4
 8     2     1     1     6
 9     3     0     0    35
10     3     0     1    20
11     3     1     0     7
12     3     1     1     5

现在很容易回答诸如&#34之类的问题;有多少X族女性吸烟并且婴儿体重不足?&#34;