我正在与巴西联邦选举数据合作。首先,这就是我得到的:
library(electionsBR)
votos <- vote_mun_zone_fed(2014)
view(votos)
votos$cidade <- paste0(votos$NOME_MUNICIPIO, "/", votos$SIGLA_UF)
votos <- subset(votos, votos$DESCRICAO_CARGO == "PRESIDENTE" & votos$NUM_TURNO == 1)
我只是导入数据并删除不适用于总统或“第一轮”的观察,因为我现在对其他职位的候选人不感兴趣。
数据框中的每个条目现在都与市政当局(由变量cidade
标识)和总统候选人(由NUMERO_CAND
标识)相关联,TOTAL_VOTOS
是变量,如何NUMERO_CAND
市政当局已收到多名cidade
名候选人。
问题是,我想创建一个变量,即每个市镇收到的每个候选人(由变量NUMERO_CAND
标识)的投票率。
我正在尝试首先创建一个变量(TOTAL_MUN
),它是每个城市所有投票的总和,因为在这种情况下,找到候选人获得的投票百分比只是一个简单的分歧,但我不知道怎么做。我用这种方式尝试aggregate
,但我不确定它是对的:
votos$TOTAL_MUN <- aggregate(TOTAL_VOTOS ~ cidade, data = votos, sum)
感谢任何帮助