在R中为xml2 :: xml_text()设置XML_PARSE_HUGE选项

时间:2015-07-15 00:07:18

标签: r memory xml-parsing

我已阅读此问题Parse XML Files (>1 megabyte) in R,此答案似乎仅适用于R中的原始XML包。如何在xml2中设置此选项?

这是我正在运行的代码:

library(xml2)
library(magrittr)

rawXML <- read_xml(xmlFile)
emails <- xml_find_all(rawXML, "//header")

emailElements <- sapply(1:length(emails), function(idx) {
attrs <- xml_attrs(emails[idx])[[1]]
index <- attrs['index']
sender <- attrs['from']
...
contentLink <- attrs['contentLink'] #is a *.html file
rawContentText <- read_html(contentLink)
content <- xml_text(rawContentText)
...
v <- c(index, date, sender, subject, headerLink, rawLink, contentLink, content, attachmentLink)
return(v)
})

这是我得到的错误:

Error: Excessive depth in document: 256 use XML_PARSE_HUGE option [1]

提前致谢。

0 个答案:

没有答案