如何提取循环遍历R中嵌套.nxml文件的值

时间:2016-09-26 19:35:06

标签: r xml nxml

我正在使用CREATE TABLE t_info(id INT PRIMARY KEY, parent_id INT, info VARCHAR(32)); 格式的发布数据 我有几个按主题分类的文件夹(每个包含100-300 .nxml文件)。我编写了以下代码从单个文件中提取abstarct并将其保存为数据框:

.nxml

适用于一个文件。

我的问题是我何时使用:

library(XML)
doc <- xmlParse("Genetics_2011_Aug_188(4)_799-808.nxml")
plant.df <- as.data.frame(t(xpathSApply(doc,"//abstract",function(x) xmlSApply(x,xmlValue))))

循环遍历一个文件夹中的文件,它将文件保存为字符,因此我无法使用files <- (list.files(pattern = "\\.nxml$")) 类型。(我得到:xmlParse

我如何循环文件或其他一些词语自动化过程? 感谢。

更新:

Error: XML content does not seem to be XML:

0 个答案:

没有答案