Question

我正在遍历目录，获取每个CSV。在每个csv中，我基于该列之一构建一个简单的频率表。从那里;我开始循环，并建立下一个频率表。我将其转换为数据框，将行绑定到上一个表，然后再次分组并计算新的总和。

for( i in 2:length(lFolders) )
{
    print( paste0("Currently evaluating folder number: ", i - 1 ) )
    lCSVPath <- paste0( lFolders[i], "/details.csv" )
    lData <- read.csv2( file = lCSVPath, header = TRUE,  sep="," )
    lTemp <- table( lData[,"name"] )

    lTemp <- lTemp %>%
        as.data.frame( stringsAsFactors = F ) %>% 
        setNames( c( "Name", "Frequency" ) )


    lTotalTable <- bind_rows( lTotalTable, lTemp ) %>% 
        group_by( User ) %>%
        summarize( Frequency = sum(Frequency) )
}

但是，这导致了巨大的频率数字，即使在早期也根本不可能。我无法弄清楚我做错了什么。我还尝试在summary函数之后运行ungroup（）。希望有人可以指引我正确的方向，并告诉我我的逻辑错在哪里。

谢谢！

通过Dplyr分组并汇总得出天文数字

0 个答案: