我导入了一些数据,包括种族,学历和结果变量作为数字。将类别var更改为有序因子。 我该怎么描述这些数据? describe.by不适用于我,但是无论如何都不知道这是正确的功能。我想独立查看(历史记录)各个种族的结果变量,但也要获取均值,标准差等。
答案 0 :(得分:0)
几件事。每当撰写文章时,我强烈建议您写下您尝试过的代码,并提供一些虚假数据供他人使用。好的问题会更快地为您提供更强有力的答案。例如,我会放置一些虚假数据,例如:
fake_data <- data.frame(
race = sample(c("A", "B"), 100, TRUE),
edu = sample(c("None", "Some", "More"), 100, TRUE),
value = rnorm(100, 50, 10)
)
如果您想获得一些基本的人口统计数据,可以执行以下操作:
library(dplyr)
fake_data %>%
group_by(race, edu) %>%
summarise(mu = mean(value),
sd = sd(value))
然后要获取直方图,您可以执行以下操作:
library(ggplot2)
fake_data %>%
ggplot(aes(value))+
geom_histogram()+
facet_wrap(~race)
但是,在没有数据示例或所需输出的情况下,我只能猜测您想要什么。