假设我在R中有data.frame
,就像这样:
dat <- data.frame(population_id = 1:3,
person_years = c(500, 800, 300),
birth = c(20, 30, 40),
death = c(10, 50, 8))
使用dplyr
,我可以使用mutate_each
轻松创建出生率和死亡率。
dat <-
dplyr::mutate_each(dat,
funs(get_rate = ./person_years,
count = as.numeric(.)),
births, deaths)
我还可以使用dplyr::summarise_each
来获取我想要的内容,例如,如果每一行都是populated_id
- 人日对,那天出生和死亡人数(注意年化)费率)。
我想在Tableau中做类似的事情,以避免必须为每种事件类型的速率创建计算字段。它需要是一个计算字段,因为我希望年度化率可以灵活地表达在不同的聚合级别。
答案 0 :(得分:0)
假设您使用的是Tableau 9.1,您应该能够通过Tableau的详细程度计算得到非常接近的结果(请参阅http://www.tableau.com/sites/default/files/media/whitepaper_lod_eng_0.pdf)。
出生率计数的示例LOD为{FIXED [Population_Id] : SUM([Birth]) / SUM([Person_Years])}
。通过该计算,包括person_id
等附加维度可使计算按预期工作。
话虽这么说,我仍然会自己处理R
中的数据。 :)