步骤-用于显示分类数据的描述性内容(均值,SD等)的代码

时间:2019-05-11 21:57:40

标签: r

我导入了一些数据,包括种族,学历和结果变量作为数字。将类别var更改为有序因子。 我该怎么描述这些数据? describe.by不适用于我,但是无论如何都不知道这是正确的功能。我想独立查看(历史记录)各个种族的结果变量,但也要获取均值,标准差等。

1 个答案:

答案 0 :(得分:0)

几件事。每当撰写文章时,我强烈建议您写下您尝试过的代码,并提供一些虚假数据供他人使用。好的问题会更快地为您提供更强有力的答案。例如,我会放置一些虚假数据,例如:

fake_data <- data.frame(
    race = sample(c("A", "B"), 100, TRUE),
    edu = sample(c("None", "Some", "More"), 100, TRUE),
    value = rnorm(100, 50, 10)
)

如果您想获得一些基本的人口统计数据,可以执行以下操作:

library(dplyr)
fake_data %>% 
    group_by(race, edu) %>% 
    summarise(mu = mean(value),
                        sd = sd(value))

然后要获取直方图,您可以执行以下操作:

library(ggplot2)

fake_data %>% 
    ggplot(aes(value))+
    geom_histogram()+
    facet_wrap(~race)

但是,在没有数据示例或所需输出的情况下,我只能猜测您想要什么。