我正在尝试创建一个使用babynames数据集的ggplot,该数据集显示了在一定年限内具有特定名称的女孩和男孩的百分比。我有点熟悉添加列,看起来像babynames $ boys + babynames $ girls如果我创建了一个列,其中包含具有特定名称的女孩数量和一列具有特定名称的男孩。到目前为止,我有点被概念性地困住了,所以我只有:
returnValue = []
size=len(data["data"])
uniqueNames = []
for i in range(0,size,1):
if(data["data"][i]["name"] not in uniqueNames):
uniqueNames.append(data["data"][i]["name"])
returnValue.append(data["data"][i])
print returnValue
答案 0 :(得分:0)
所以你想要百分比?
尝试:
babynames %>%
filter(name == "Jordan") %>%
group_by(year, sex) %>%
summarize(total = sum(n)) %>%
mutate(both = sum(total)) %>%
mutate(perc = total/both*100)