我想使用列表和file.info
函数用文件信息填充现有的空数据框。我一直在使用for
循环执行相同的任务,但想学习如何使用apply
系列,并认为这将是一个很好的简单示例。
我的列表...
listOfFiles_M <- c("I:\\temp\\APIS2//APIS01/WAV/APIS01_20170414_150000.wav", "I:\\temp\\APIS2//APIS01/WAV/APIS01_20170414_160000.wav",
"I:\\temp\\APIS2//APIS01/WAV/APIS01_20170414_170000.wav", "I:\\temp\\APIS2//APIS01/WAV/APIS01_20170414_180000.wav"
)
我的空数据框...
m_files <- structure(list(size = numeric(0), isdir = logical(0), mode = structure(integer(0), class = "octmode"),
mtime = structure(numeric(0), class = c("POSIXct", "POSIXt"
)), ctime = structure(numeric(0), class = c("POSIXct", "POSIXt"
)), atime = structure(numeric(0), class = c("POSIXct", "POSIXt"
)), exe = character(0)), .Names = c("size", "isdir", "mode",
"mtime", "ctime", "atime", "exe"), row.names = character(0), class = "data.frame")
我的功能...
test.info <- function(i,x){
print (i)
x[i,]=c(file.info(i))
}
我认为我应该这样使用lapply
...
lapply(listOfFiles_M, test.info)
这是一个示例,我希望填充的m_files
看起来像...
m_files <- structure(list(rn = c("I:\\temp\\APIS2//APIS01/WAV/APIS01_20170414_150000.wav",
"I:\\temp\\APIS2//APIS01/WAV/APIS01_20170414_160000.wav", "I:\\temp\\APIS2//APIS01/WAV/APIS01_20170414_170000.wav",
"I:\\temp\\APIS2//APIS01/WAV/APIS01_20170414_180000.wav"), size = c(9601276,
9601276, 9601276, 9601276), isdir = c(FALSE, FALSE, FALSE, FALSE
), mode = structure(c(438L, 438L, 438L, 438L), class = "octmode"),
mtime = structure(c(1492200300, 1492203900, 1492207500, 1492211100
), class = c("POSIXct", "POSIXt")), ctime = structure(c(1537974713.78911,
1537974713.85152, 1537974713.89832, 1537974713.92952), class = c("POSIXct",
"POSIXt")), atime = structure(c(1537974713.78911, 1537974713.85152,
1537974713.89832, 1537974713.92952), class = c("POSIXct",
"POSIXt")), exe = c("no", "no", "no", "no")), .Names = c("rn",
"size", "isdir", "mode", "mtime", "ctime", "atime", "exe"), row.names = c(NA,
-4L), class = "data.frame")
编辑:我还应该提到有一个很大的列表,大约200,000个项目,因此rbind
可能不是一个好的解决方案。
答案 0 :(得分:1)
只需将文件列表传递到file.info
即可,该文件可以接收多个值作为输入,并根据文档?file.info
返回数据帧。
final_df <- file.info(listOfFiles_M)
无需初始化一个空的数据框并将其映射到它或rbind
迭代返回的对象。
答案 1 :(得分:0)
我假设函数file.info
旨在获取文件名,然后吐出一个长度为7的向量,该向量用于填充一行。
仅是一项建议,当我们至少有1个文件没有file.info
函数的输出时,这很难测试。因此,我建议您在发布时简化m_files数据框。
我相信唯一的问题是您需要在lapply中指定x参数。
lapply(listOfFiles_M, test.info, x = m_files)
apply中的...
自变量是您列出传递的apply函数可能需要的其他功能,在这种情况下为test.info
。