我正在努力重建五三八的“最年轻的男性名字”图片:https://espnfivethirtyeight.files.wordpress.com/2014/05/silver-feature-youngest-men-names3.png?w=575&quality=90&strip=info
目前我正在准备绘制数据之前对数据进行争论。我首先按性别过滤数据,然后按名称对数据进行分组。但是,我还需要按{{过滤结果1}}我无法确定在哪里包含此过滤器函数以便正确获取数据。
est_num_alive > 100,000
现在,这段代码返回一组名字,这些名字今天只有1个人活着,并且所有人的中位年龄都是4岁。例如:Aadhavan的中位年龄为4岁,只有1岁。
答案 0 :(得分:1)
young_male <- BabynamesDist %>%
filter(sex == "M") %>%
group_by(name) %>%
mutate(est_num_alive = sum(est_alive_today)) %>%
filter(est_num_alive > 100000) %>%
summarise(
N = n(),
q1_age = wtd.quantile(age_today, est_alive_today, probs = 0.25),
median_age = wtd.quantile(age_today, est_alive_today, probs = 0.5),
q3_age = wtd.quantile(age_today, est_alive_today, probs = 0.75)
) %>%
arrange(desc(-median_age))
我认为这就是您的目标,尽可能地推断出有关数据帧的信息。如果这不起作用,请告诉我。