有人可以告诉我如何在R中使用循环变量访问编号数据集? 所以,如果我有一个很长的文件列表,我需要在每个文件中找到特定值在第二列中的所有位置,并在第三列的同一行中取相应的值,并将这些列在一个文件中,我怎么能这样做?这些文件分别以文件夹的标题,日期和时间命名,名称为“name_0619_0123”。每天的文件数量相同,而且每天都有。因此,如果有一个命令可以某种方式让我以这样的方式访问文件,我可以在命令中为文件名提供的字符串中有一个变量(取决于循环计数变量),我可以访问每次循环迭代都有不同的文件。
请提出任何想法
另外,如果我有更合适的地方提出这个问题,请告诉我。
答案 0 :(得分:1)
在R中可能有很多方法可以做到这一点:
您可以使用命令行脚本(请参阅R documentation)。
即。
R CMD BATCH "--args arg1 arg2" foo.R &
foo.R
是你的R脚本,args
可以是你感兴趣的循环变量。
另一种方法是使用regular expressions来解析文件名中的信息。
如果您提供更具体的示例,我将能够向您展示更具体的代码。
答案 1 :(得分:0)
以下是一些指导原则,如果您可以使用模式处理您需要处理的文件或者拾取所有这些文件。
您可以使用list.files
生成一个文件列表,使用lapply
,read.csv
一次性阅读这些文件,然后使用单个data.frame
获取所需内容行。然后,使用do.call
,rbind
和您的data.frames列表,您可以将所有内容组合到一个data.frame中,甚至无需明确写入for
。