Question

我正在努力重建五三八的“最年轻的男性名字”图片：https://espnfivethirtyeight.files.wordpress.com/2014/05/silver-feature-youngest-men-names3.png?w=575&quality=90&strip=info

目前我正在准备绘制数据之前对数据进行争论。我首先按性别过滤数据，然后按名称对数据进行分组。但是，我还需要按{{过滤结果1}}我无法确定在哪里包含此过滤器函数以便正确获取数据。

est_num_alive > 100,000

现在，这段代码返回一组名字，这些名字今天只有1个人活着，并且所有人的中位年龄都是4岁。例如：Aadhavan的中位年龄为4岁，只有1岁。

Answer 1

young_male <- BabynamesDist %>%
  filter(sex == "M") %>%
  group_by(name) %>%
  mutate(est_num_alive = sum(est_alive_today)) %>%
  filter(est_num_alive > 100000) %>%
  summarise(
    N = n(), 
    q1_age = wtd.quantile(age_today, est_alive_today, probs = 0.25),
    median_age = wtd.quantile(age_today, est_alive_today, probs = 0.5),
    q3_age = wtd.quantile(age_today, est_alive_today, probs = 0.75)
  ) %>%
  arrange(desc(-median_age))

我认为这就是您的目标，尽可能地推断出有关数据帧的信息。如果这不起作用，请告诉我。

在r中汇总（）中的过滤

1 个答案: