如何在数据框中创建一个新变量,该变量是另一个变量

时间:2018-02-23 19:14:34

标签: r

我正在与巴西联邦选举数据合作。首先,这就是我得到的:

library(electionsBR)

votos <- vote_mun_zone_fed(2014)
view(votos)
votos$cidade <- paste0(votos$NOME_MUNICIPIO, "/", votos$SIGLA_UF)
votos <- subset(votos, votos$DESCRICAO_CARGO == "PRESIDENTE" & votos$NUM_TURNO == 1)

我只是导入数据并删除不适用于总统或“第一轮”的观察,因为我现在对其他职位的候选人不感兴趣。

数据框中的每个条目现在都与市政当局(由变量cidade标识)和总统候选人(由NUMERO_CAND标识)相关联,TOTAL_VOTOS是变量,如何NUMERO_CAND市政当局已收到多名cidade名候选人。

问题是,我想创建一个变量,即每个市镇收到的每个候选人(由变量NUMERO_CAND标识)的投票率。

我正在尝试首先创建一个变量(TOTAL_MUN),它是每个城市所有投票的总和,因为在这种情况下,找到候选人获得的投票百分比只是一个简单的分歧,但我不知道怎么做。我用这种方式尝试aggregate,但我不确定它是对的:

votos$TOTAL_MUN <- aggregate(TOTAL_VOTOS ~ cidade, data = votos, sum)

感谢任何帮助

0 个答案:

没有答案