我正在遍历目录,获取每个CSV。在每个csv中,我基于该列之一构建一个简单的频率表。从那里;我开始循环,并建立下一个频率表。我将其转换为数据框,将行绑定到上一个表,然后再次分组并计算新的总和。
for( i in 2:length(lFolders) )
{
print( paste0("Currently evaluating folder number: ", i - 1 ) )
lCSVPath <- paste0( lFolders[i], "/details.csv" )
lData <- read.csv2( file = lCSVPath, header = TRUE, sep="," )
lTemp <- table( lData[,"name"] )
lTemp <- lTemp %>%
as.data.frame( stringsAsFactors = F ) %>%
setNames( c( "Name", "Frequency" ) )
lTotalTable <- bind_rows( lTotalTable, lTemp ) %>%
group_by( User ) %>%
summarize( Frequency = sum(Frequency) )
}
但是,这导致了巨大的频率数字,即使在早期也根本不可能。我无法弄清楚我做错了什么。我还尝试在summary函数之后运行ungroup()。希望有人可以指引我正确的方向,并告诉我我的逻辑错在哪里。
谢谢!