R - 拆分数据框并保存到不同的文件

时间:2015-10-30 00:22:44

标签: r file split dataframe

我有一个数据框,其中包含多个地点的月度温度数据:

    > df4[1:36,]
       location    variable cut month year freq
1    Adamantina temperature  10   Jan 1981 21.0
646  Adamantina temperature  10   Feb 1981 20.5
1291 Adamantina temperature  10   Mar 1981 21.5
1936 Adamantina temperature  10   Apr 1981 21.5
2581 Adamantina temperature  10   May 1981 24.0
3226 Adamantina temperature  10   Jun 1981 21.5
3871 Adamantina temperature  10   Jul 1981 22.5
4516 Adamantina temperature  10   Aug 1981 23.5
5161 Adamantina temperature  10   Sep 1981 19.5
5806 Adamantina temperature  10   Oct 1981 21.5
6451 Adamantina temperature  10   Nov 1981 23.0
7096 Adamantina temperature  10   Dec 1981 19.0
2        Adolfo temperature  10   Jan 1981 24.0
647      Adolfo temperature  10   Feb 1981 20.0
1292     Adolfo temperature  10   Mar 1981 24.0
1937     Adolfo temperature  10   Apr 1981 23.0
2582     Adolfo temperature  10   May 1981 18.0
3227     Adolfo temperature  10   Jun 1981 21.0
3872     Adolfo temperature  10   Jul 1981 22.0
4517     Adolfo temperature  10   Aug 1981 19.0
5162     Adolfo temperature  10   Sep 1981 19.0
5807     Adolfo temperature  10   Oct 1981 24.0
6452     Adolfo temperature  10   Nov 1981 24.0
7097     Adolfo temperature  10   Dec 1981 24.0
3         Aguai temperature  10   Jan 1981 24.0
648       Aguai temperature  10   Feb 1981 20.0
1293      Aguai temperature  10   Mar 1981 22.0
1938      Aguai temperature  10   Apr 1981 20.0
2583      Aguai temperature  10   May 1981 21.5
3228      Aguai temperature  10   Jun 1981 20.5
3873      Aguai temperature  10   Jul 1981 24.0
4518      Aguai temperature  10   Aug 1981 23.5
5163      Aguai temperature  10   Sep 1981 18.5
5808      Aguai temperature  10   Oct 1981 21.0
6453      Aguai temperature  10   Nov 1981 22.0
7098      Aguai temperature  10   Dec 1981 23.5

我需要做的是按位置以编程方式拆分此数据框,并为每个位置创建一个.Rdata文件。

在上面的示例中,我将有三个不同的文件 - Adamantina.Rdata,Adolfo.Rdata和Aguai.Rdata - 包含所有列,但只包含与这些位置对应的行。

它需要高效且具有编程性,因为在我的实际数据中,我有大约700个不同的位置和每个位置大约50年的数据。

提前致谢。

2 个答案:

答案 0 :(得分:3)

要拆分数据框,请使用split(df4, df4$location)。它将创建名为AdamantinaAdolfoAguai等的数据框。

要将这些新数据框保存到locations.RData文件中,请使用save(Adamantina, Adolfo, Aguai, file="locations.RData")save.image(file="filename.RData")会将当前R会话中的所有内容保存到filename.RData文件中。

您可以详细了解savesave.image here

编辑:

如果拆分数量过大,请使用此方法:

locations <- split(df4, df4$location)
save(locations, "locations.RData")
然后

locations.RData将作为列表加载。

答案 1 :(得分:2)

这是借用之前的答案,但我不相信你想要的答案。

首先,正如他们所建议的那样,您想要拆分数据集。

splitData <- split(df4, df4$location)

现在,要逐个浏览此列表,保存数据集,可以通过删除名称来完成:

 allNames <- names(splitData)
 for(thisName in allNames){
     saveName = paste0(thisName, '.Rdata')
     saveRDS(splitData[[thisName]], file = saveName)
}