我正在使用CREATE TABLE t_info(id INT PRIMARY KEY, parent_id INT, info VARCHAR(32));
格式的发布数据
我有几个按主题分类的文件夹(每个包含100-300 .nxml文件)。我编写了以下代码从单个文件中提取abstarct并将其保存为数据框:
.nxml
适用于一个文件。
我的问题是我何时使用:
library(XML)
doc <- xmlParse("Genetics_2011_Aug_188(4)_799-808.nxml")
plant.df <- as.data.frame(t(xpathSApply(doc,"//abstract",function(x) xmlSApply(x,xmlValue))))
循环遍历一个文件夹中的文件,它将文件保存为字符,因此我无法使用files <- (list.files(pattern = "\\.nxml$"))
类型。(我得到:xmlParse
)
我如何循环文件或其他一些词语自动化过程? 感谢。
更新:
Error: XML content does not seem to be XML: