在R中,如何使用循环变量访问编号数据集?

时间:2014-06-19 17:32:47

标签: r

有人可以告诉我如何在R中使用循环变量访问编号数据集? 所以,如果我有一个很长的文件列表,我需要在每个文件中找到特定值在第二列中的所有位置,并在第三列的同一行中取相应的值,并将这些列在一个文件中,我怎么能这样做?这些文件分别以文件夹的标题,日期和时间命名,名称为“name_0619_0123”。每天的文件数量相同,而且每天都有。因此,如果有一个命令可以某种方式让我以这样的方式访问文件,我可以在命令中为文件名提供的字符串中有一个变量(取决于循环计数变量),我可以访问每次循环迭代都有不同的文件。

请提出任何想法

另外,如果我有更合适的地方提出这个问题,请告诉我。

2 个答案:

答案 0 :(得分:1)

在R中可能有很多方法可以做到这一点:

您可以使用命令行脚本(请参阅R documentation)。

即。

R CMD BATCH "--args arg1 arg2" foo.R &

foo.R是你的R脚本,args可以是你感兴趣的循环变量。

另一种方法是使用regular expressions来解析文件名中的信息。

如果您提供更具体的示例,我将能够向您展示更具体的代码。

答案 1 :(得分:0)

以下是一些指导原则,如果您可以使用模式处理您需要处理的文件或者拾取所有这些文件。

您可以使用list.files生成一个文件列表,使用lapplyread.csv一次性阅读这些文件,然后使用单个data.frame获取所需内容行。然后,使用do.callrbind和您的data.frames列表,您可以将所有内容组合到一个data.frame中,甚至无需明确写入for