XMLtoDataFrame:“列的重复下标”当尝试加载多个文件(R)时

时间:2016-11-15 05:52:53

标签: r xml lapply rbind

我正在尝试从R中的文件夹中加载许多文件,这些文件的格式为“.xml”。这些文件包含在包含任何子文件夹的一个文件夹中。我尝试使用以下代码一次性获取它们:

allfiles <- list.files("MyDirectory", pattern = '*.xml', recursive = TRUE, full.names = TRUE)
hope <- do.call(rbind.fill,lapply(allfiles,xmlToDataFrame))

不幸的是,这是结果:

"Error in `[<-.data.frame`(`*tmp*`, i, names(nodes[[i]]), value = c("12786998421436773",  : duplicate subscripts for columns'"

我甚至不确定问题是什么?当我通过单个文件执行它时,它可以工作,但是有超过30,000个文件,因此它不可行。我尝试了一种不同的方式(使用for循环)但是会出现类似“xml文件不是XML类型”的错误,即使它输出的文件名以“.xml”标记结尾。

任何清晰度都将非常感激。

0 个答案:

没有答案