R lapply使用stringi和rbind

时间:2016-05-31 15:32:27

标签: r lapply rbind stringi

我想通过特定字符串在数据框中拆分一些数据并计算频率。

用几种方法玩弄后,我想出了一个方法,但是我的结果有一点点错误。

示例:

数据框数据文件:

data
abc hello
hello
aaa
zxy
xyz

列表:

list
abc
bcd
efg
aaa

我的代码:

lapply(list$list, function(x){
    t <- data.frame(words = stri_extract(df$data, coll=x))
    t<- setDT(t)[, .( Count = .N), by = words]
    t<-t[complete.cases(t$words)]
    result<-rbind(result,t)
    write.csv(result, "new.csv", row.names = F)
})

在这个例子中,我希望CSV文件具有以下结果:

words Count
abc     1
aaa     1

然而,我得到了我的代码:

words Count
aaa     1

我知道stri_extract应该在abc中识别abc hello,所以当我使用rbind时可能会发生错误?

1 个答案:

答案 0 :(得分:3)

您需要将write.csv文件移出循环,否则它将覆盖以前保存的文件,您只会在最后阶段保存文件。通过这样做,您必须在rbind之外lapply结果,因为您无法修改函数中的result变量。

result <- do.call(rbind, lapply(list$list, function(x){
                                t <- data.frame(words = stri_extract(df$data, coll=x))
                                t<- setDT(t)[, .( Count = .N), by = words]
                                t<-t[complete.cases(t$words)]
                                t
 }))

write.csv(result, "new.csv", row.names = F)