通过Dplyr分组并汇总得出天文数字

时间:2018-10-26 02:19:44

标签: r dplyr

我正在遍历目录,获取每个CSV。在每个csv中,我基于该列之一构建一个简单的频率表。从那里;我开始循环,并建立下一个频率表。我将其转换为数据框,将行绑定到上一个表,然后再次分组并计算新的总和。

for( i in 2:length(lFolders) )
{
    print( paste0("Currently evaluating folder number: ", i - 1 ) )
    lCSVPath <- paste0( lFolders[i], "/details.csv" )
    lData <- read.csv2( file = lCSVPath, header = TRUE,  sep="," )
    lTemp <- table( lData[,"name"] )

    lTemp <- lTemp %>%
        as.data.frame( stringsAsFactors = F ) %>% 
        setNames( c( "Name", "Frequency" ) )


    lTotalTable <- bind_rows( lTotalTable, lTemp ) %>% 
        group_by( User ) %>%
        summarize( Frequency = sum(Frequency) )
}

但是,这导致了巨大的频率数字,即使在早期也根本不可能。我无法弄清楚我做错了什么。我还尝试在summary函数之后运行ungroup()。希望有人可以指引我正确的方向,并告诉我我的逻辑错在哪里。

谢谢!

0 个答案:

没有答案