R中的问题,将分割数据帧保存为新文件

时间:2016-05-17 21:46:29

标签: r dataframe save lapply chunks

我已经搜索了一些与此相关的问题,但我仍然遇到问题。

我有一个140万的数据帧加载到R中,包含~56辆车的gps路线数据。我使用split()函数通过总线名称将公交数据解析为较小的块(总线名称示例:' 1367 / E0007489')。我使用了以下代码行:

dfs <- split(sater001_paired, f=sater001_paired[, "vehicleName"])

sater001_paired是我的数据框,而vehicleName是我分割的变量。考虑到这些数据是实时捕获的,每个块的行数不均匀。

我现在面临的问题是尝试将每个块保存到自己的.csv文件中。我尝试使用lapply:

lapply(names(dfs), function(x){write.table(dfs[[x]], file = paste("bus", x, sep = ""))})

但是R返回错误消息&#34;无法打开连接&#34;。我可能会遗漏一些东西,因为我在使用lapply功能时非常生疏。

基于此的任何建议?

1 个答案:

答案 0 :(得分:0)

MrFlick帮我意识到我在这里遇到的问题。

所以,为了关闭它,我在每个识别码的中途包含一个正斜杠的车辆名称列。由于Windows上的Rstudio并不善待这些角色,我没有意识到这一点,因为我最近才从主要使用Mac OS切换。

在以下代码中使用gsub

sater001_paired$vehicleName <- gsub('/', '-', sater001_paired$vehicleName)

此问题现已解决。再次感谢MrFlick的帮助。