我已经搜索了一些与此相关的问题,但我仍然遇到问题。
我有一个140万的数据帧加载到R中,包含~56辆车的gps路线数据。我使用split()
函数通过总线名称将公交数据解析为较小的块(总线名称示例:' 1367 / E0007489')。我使用了以下代码行:
dfs <- split(sater001_paired, f=sater001_paired[, "vehicleName"])
sater001_paired
是我的数据框,而vehicleName
是我分割的变量。考虑到这些数据是实时捕获的,每个块的行数不均匀。
我现在面临的问题是尝试将每个块保存到自己的.csv
文件中。我尝试使用lapply:
lapply(names(dfs), function(x){write.table(dfs[[x]], file = paste("bus", x, sep = ""))})
但是R返回错误消息&#34;无法打开连接&#34;。我可能会遗漏一些东西,因为我在使用lapply
功能时非常生疏。
基于此的任何建议?
答案 0 :(得分:0)
所以,为了关闭它,我在每个识别码的中途包含一个正斜杠的车辆名称列。由于Windows上的Rstudio并不善待这些角色,我没有意识到这一点,因为我最近才从主要使用Mac OS切换。
在以下代码中使用gsub
:
sater001_paired$vehicleName <- gsub('/', '-', sater001_paired$vehicleName)
此问题现已解决。再次感谢MrFlick的帮助。