在r中汇总()中的过滤

时间:2017-10-07 20:18:39

标签: r dataframe dplyr

我正在努力重建五三八的“最年轻的男性名字”图片:https://espnfivethirtyeight.files.wordpress.com/2014/05/silver-feature-youngest-men-names3.png?w=575&quality=90&strip=info

目前我正在准备绘制数据之前对数据进行争论。我首先按性别过滤数据,然后按名称对数据进行分组。但是,我还需要按{{过滤结果1}}我无法确定在哪里包含此过滤器函数以便正确获取数据。

est_num_alive > 100,000

现在,这段代码返回一组名字,这些名字今天只有1个人活着,并且所有人的中位年龄都是4岁。例如:Aadhavan的中位年龄为4岁,只有1岁。

1 个答案:

答案 0 :(得分:1)

young_male <- BabynamesDist %>%
  filter(sex == "M") %>%
  group_by(name) %>%
  mutate(est_num_alive = sum(est_alive_today)) %>%
  filter(est_num_alive > 100000) %>%
  summarise(
    N = n(), 
    q1_age = wtd.quantile(age_today, est_alive_today, probs = 0.25),
    median_age = wtd.quantile(age_today, est_alive_today, probs = 0.5),
    q3_age = wtd.quantile(age_today, est_alive_today, probs = 0.75)
  ) %>%
  arrange(desc(-median_age))

我认为这就是您的目标,尽可能地推断出有关数据帧的信息。如果这不起作用,请告诉我。